Post #414

@ai_render_yaroshik

Папка: /ai/render/

Прагляды393Колькасць прагляданняў

Апублікавана20 мая20.05.2026, 04:48

Змест

Змест паведамлення

Google I/O 2026: что такое Gemini Omni и зачем это знать Вчера Google анонсировал Gemini Omni — мультимодальную систему, которая принимает на вход любую комбинацию текста, изображений, аудио и видео, и генерирует из этого видео. Пока это звучит как «ещё один видеогенератор». Но архитектура интереснее. Omni — это не отдельный инструмент, а попытка объединить reasoning Gemini с генеративными медиамоделями (Veo, Genie, DeepMind Nano Banana) в одну систему. Модель понимает физику, гравитацию, движение объектов — и может редактировать видео через диалог, не через таймлайн. Что это значит на практике: — загружаешь своё видео, описываешь изменения в тексте → среда, стиль, угол камеры меняются — можно создать аватар со своим голосом и генерировать видео, где выглядишь и звучишь как ты — все видео маркируются водяным знаком SynthID Первая модель семейства — Omni Flash — уже доступна подписчикам Google AI Plus/Pro/Ultra через Gemini и Google Flow. На YouTube Shorts — со следующей недели, бесплатно. Пост в ленте, который я видела, называет это «конец интернета». Это преувеличение. Но если Omni действительно умеет то, что показывает Google — редактирование через диалог без таймлайна — это меняет пайплайн для motion-дизайнеров серьёзнее, чем очередной text-to-video. Слежу. Тестирую, когда будет доступ.