Содержимое
✨Microsoft показали нейросеть, которая по одному портретному фото и аудиодорожке создаст супер реалистичное видео. Синхронизация губ, живое выражение лица и естественное движение головы при разговоре!😱 Нейросеть называется VASA. На входе одно статичное портретное изображение и аудиодорожка с речью. Будет поддерживаться даже онлайн-генерация в реальном времени с разрешением 512х512 и 40 кадров в секунду с незначительной задержкой. Пощупать пока нельзя, есть только paper со множеством примеров https://www.microsoft.com/en-us/research/project/vasa-1/ Но радует, что таких анонсов от различных компаний становится всё больше, а значит уже скоро мы перестанем различать в сети живых людей на видео и сгенерированных. Давно жду такой инструмент для генерации маркетинговых UGC креативов. Пока ничего адекватного нет. ИИволюция☕️