@ilia_plasma · Post #599 · 23.12.2024, 08:57
#Google решил ворваться в рынок видео AI генераторов и выкатил свой Veo 2. OpenAI Sora просто курит в сторонке глядя на такое качество физики.
Hashtags
TGINSIGHT SIMILAR POSTS
Источник @ai_machinelearning_big_data · Post #8006 · 10 июл.
⚡️ 5Gemma: новая коллекция энкодер-декодер моделей от Google. Инженеры Google DeepMind решили вдохнуть новую жизнь в классический подход «энкодер-декодер» выпустив семейство моделей T5Gemma. Главная интрига заключается не в том, что они сделали, а в том, как. Вместо того чтобы обучать модели с нуля, они разработали метод «адаптации»: взяли уже готовую и предобученную модель-декодер Gemma 2 и, по сути, пересобрали ее в двухкомпонентную энкодер-декодерную архитектуру. Метод открыл дорогу для интересных экспериментов. Например, стало возможно создавать «несбалансированные» модели, комбинируя большой энкодер с маленьким декодером, скажем, 9-миллиардный энкодер и 2-миллиардный декодер. Такая конфигурация идеальна для задач суммаризации, где глубокое понимание исходного текста (работа энкодера) гораздо важнее, чем генерация сложного и витиеватого ответа (работа декодера). Это дает инженерам гибкий инструмент для тонкой настройки баланса между качеством и скоростью работы. 🟡Но самое важное - прирост в производительности. На тестах T5Gemma показывает результаты на уровне или даже лучше своих «однокомпонентных» аналогов. Асимметричная модель T5Gemma 9B-2B демонстрирует значительно более высокую точность, чем базовая Gemma 2 2B, но при этом скорость инференса у них почти идентична. Даже сбалансированная T5Gemma 9B-9B оказывается точнее, чем Gemma 2 9B, при сопоставимой задержке. Это прямое доказательство того, что двухкомпонентная архитектура может быть и умнее, и эффективнее. T5Gemma показывает впечатляющий рост в задачах, требующих логических рассуждений. Например, на математическом тесте GSM8K модель T5Gemma 9B-9B набирает на 9 баллов больше, чем Gemma 2 9B. Эффект становится еще более выраженным после инструктивной донастройки. Здесь разрыв в производительности резко увеличивается: на бенчмарке MMLU модель T5Gemma 2B-2B IT опережает аналог Gemma 2 2B IT почти на 12 баллов. 🟡Google выложила в открытый доступ целую линейку чекпойнтов: 🟢T5 (Small, Base, Large, XL) на базе Gemma (2B, 9B); 🟢«Несбалансированную» версию 9B-2B для экспериментов; 🟢Модели с разными целями обучения (PrefixLM для генерации, UL2 для качества представлений). 🔜 Попробовать возможности T5Gemma или настроить их под свои нужды можно с помощью блокнота Colab. Модели также доступны в Vertex AI. 📌Лицензирование: Gemma License. 🟡T5gemma: https://developers.googleblog.com/en/t5gemma/ 🟡Статья: https://arxiv.org/abs/2504.06225 🟡Скачать модель: https://huggingface.co/collections/google/t5gemma-686ba262fe290b881d21ec86 @ai_machinelearning_big_data #AI#ML#T5Gemma#Google
@ilia_plasma · Post #599 · 23.12.2024, 08:57
#Google решил ворваться в рынок видео AI генераторов и выкатил свой Veo 2. OpenAI Sora просто курит в сторонке глядя на такое качество физики.
Hashtags
@ilia_plasma · Post #388 · 24.01.2024, 14:52
По генерации видео из текста мы сейчас где то тут по качеству. LUMIERE Powered by #Google
Hashtags
@AliKuzhuget · Post #106 · 27.07.2025, 17:11
Через неделю будут готовы переводы датасета SMOL от Гугла с Английского на Русский. Потом еще вычитка будет. Этот сбалансированный датасет для улучшения переводчика Гугла. Это позволит переводчикам переводить с Русского на свой язык и добавить/улучшить его в переводчике. Предполагаемый релиз будет в следующем году. Датасет содержит 2 таблицы: smolsent, smoldoc. Опционально, есть датасет gatitos (самые популярные слова на английском, нужно перевести/проверить на свой язык). У кого хороший английский, может уже сейчас переводить на свой язык. Кому надо, пишите в комментах. #google
Hashtags
@ilia_plasma · Post #347 · 06.12.2023, 15:22
💎 Google запускает Gemini AI, которая лучше чем chatGPT 4 и проинтегрирована во все продукты #Google. Основные моменты: Мультифункциональность: Gemini разработана с нуля как мультимодальная модель, способная обрабатывать и объединять текст, код, аудио, изображения и видео. Гибкость и Оптимизация: Модель представлена в трех вариациях: Gemini Ultra для сложных задач, Gemini Pro для широкого спектра задач и Gemini Nano для задач, выполняемых на устройствах. Превосходящая Производительность: Gemini Ultra превзошла человеческих экспертов в тестах на многоязычное понимание, а также показала впечатляющие результаты в задачах, связанных с текстом и программированием. Продвинутое Мультимодальное Рассуждение: Gemini обладает способностью к сложному рассуждению, что делает её особенно подходящей для понимания и объяснения тем в области математики и физики. Эффективность и Надежность: Обучение Gemini 1.0 проводилось на специализированных AI-оптимизированных инфраструктурах, используя процессоры Google Tensor Processing Units. Ответственный и Безопасный #AI: Google уделяет особое внимание безопасности и ответственности, внедряя новые меры защиты для учета мультимодальных возможностей Gemini. Широкое Применение: Gemini уже внедряется в продукты Google, включая Bard и смартфоны Pixel, а также будет доступна через API для разработчиков и предприятий. Планы на Будущее: Для Gemini Ultra в настоящее время проводятся обширные проверки безопасности и доводка модели, после чего она станет доступна для широкой публики. 🔥 Чат для общения с моделью Gemini Pro завезли в Bard: https://bard.google.com/chat
@the_ai · Post #760 · 26.12.2023, 13:07
В течение года количество поисковых запросов «AI» в Google было больше, чем «bitcoin» и «crypto» вместе взятых. #AI#Google
@the_ai · Post #708 · 07.07.2023, 00:29
🗣 В последних обновлениях политики конфиденциальности Google разрешила сбор общедоступных данных для обучения продуктов на основе искусственного интеллекта. В версии политики от 1 июля 2023 года сказано, что компания будет собирать данные для обучения ИИ-моделей и развития своих продуктов, таких как Google Translate, Bard и Cloud AI. #Google
Hashtags
@the_ai · Post #681 · 09.05.2023, 04:11
🔎Google планирует сделать поисковик более «персонализированным, визуальным, удобным и человечным» с упором на молодежную аудиторию. По данным The Wall Street Journal, техгигант расширит систему чатом с ИИ под кодовым названием Magi. Также он уделит больше внимания ситуациям, когда традиционная выдача не может служить ответом на запрос. В таких случаях поисковик попросит задать дополнительные вопросы или предложит больше визуальных элементов вроде видео из TikTok. 📅 Ожидается, что компания представит новые функции на мероприятии Google I/O, которое состоится 10 мая 2023 года. #Google
Hashtags
@the_ai · Post #660 · 11.04.2023, 01:34
🌐Googleдобавит в Chrome 113 функцию WebGPU, позволяющую использовать видеокарту для ускорения ИИ, онлайн-игр и графики. API будет включен по умолчанию на ПК с Windows с поддержкой Direct3D 12, MacOS (Metal) и ChromeOS (Vulkan). По данным компании, WebGPU позволит разработчикам достичь существующего уровня графики с гораздо меньшим количеством кода. Также он обеспечит более чем трехкратное ускорение логических выводов моделей машинного обучения. 🧱 В Google также заявили, что релиз Chrome 113 служит «строительным блоком» для грядущих обновлений и улучшений, обещая более продвинутые графические функции и глубокий доступ к ядрам шейдеров в будущем. #Google
Hashtags
@the_ai · Post #647 · 25.03.2023, 02:54
👀Googleоткрыла доступ к Immersive view в Maps некоторым пользователям. Функция предназначена для просмотра фотореалистичных 3D-репродукций городов. При ее разработке инженеры объединили «тысячи снимков» Street View для создания точных копий различных локаций. 📆 В феврале 2023 года Google заявила, что система стала доступна в Лондоне, Лос-Анджелесе, Нью-Йорке, Сан-Франциско и Токио. Однако тогда мало кто обнаружил эту функцию в Maps. Теперь журналисты Gizmodo подтвердили, что Immersive view доступна в Лос-Анджелесе, Нью-Йорке и даже в Берлине. Также некоторые пользователи смогли протестировать функцию в Лондоне. 🗺 По данным Google, следующими городами, которые получат иммерсивное представление, будут Амстердам, Дублин, Флоренция и Венеция. #Google
Hashtags
@the_ai · Post #638 · 21.03.2023, 13:05
📱 СМИ: смартфоны Google Pixel 8, вероятно, получат ИИ-инструмент повышения резкости видео Video Unblur. Журналисты 9to5Google проанализировали программный код APK-файлов для приложения Photos, загруженных компанией в Play Store. В результате декомпиляции они смогли запустить пользовательский интерфейс для инструмента и протестировать технологию. 📆 Video Unblur не смог заметно изменить видео. Вероятно, система все еще находится на стадии разработки. Ожидается, что Google покажет инструмент на конференции I/O 2023 10 мая. #Google
Hashtags
@the_ai · Post #609 · 01.03.2023, 05:50
👀 Исследователи Google Researchразработали ИИ-модель Spotlight, способную одновременно решать несколько задач пользовательского интерфейса (UI). Система базируется на нейросетях-трансформерах для распознавания изображений ViT и преобразования «текста в текст» T5. Входные данные алгоритма могут включать три элемента: скриншот, определенную область на экране и текстовый запрос. В результате модель выдаст словесное описание или ответ на интересующий вопрос. ⚙️ По словам разработчиков, Spotlight существенно повышает точность выполнения UI-задач, включая создание подписей к виджетам, сводок экранов, привязки команд и прогнозирование нажатий. #Google
Hashtags
@the_ai · Post #595 · 18.02.2023, 21:45
📱Googleвыпустила бета-версию системы рекламных профилей Privacy Sandbox для Android. Технология представляет собой набор инструментов, призванных задать новый стандарт доступа рекламодателей и сайтов к информации о потребителях без компрометации конфиденциальности данных. На сегодня каждому Android-устройству присваивается уникальный идентификатор Advertising ID. Он позволяет отслеживать поведение пользователя и создавать личный рекламный профиль, который могут использовать разработчики. 🔎 Privacy Sandbox заменит идентификаторы API со списком интересов потребителей. Затем система сравнит их с базой данных Interactive Advertising Bureau и сведениями Google. Рекламодатели смогут пинговать API, показывая релевантные предложения согласно списку интересов, которые «хранятся всего три недели». В компании отметили, что обработка данных происходит «без привлечения каких-либо внешних серверов, включая Google». 👥 Пока Privacy Sandbox доступна ограниченному числу пользователей устройств с Android 13. #Google
Hashtags