帖子内容
🐱 Обзор на Sora 2 и Veo 3.1 на примере Звездных войн: восстание мопсов Протестировал новые модели Sora 2 Pro и Veo 3.1. Делюсь реальными результатами, цифрами и честными выводами. Досмотрите только ролик до конца) Я стараюсь обходить стороной дорогие модели: генерирую много, а с нынешними ценами можно одним роликом слить всю подписку. Поэтому считаю важным рассказать про плюсы и минусы, потому что цена ошибки высока. Тест проводил на моделях Veo 3.1 Fast, Veo 3.1 и Sora 2 Pro. План был такой: генерирую в 1080p по 8 секунд, чтобы у меня было больше качественного материала, и на монтаже было легче убрать дефекты 💩 🙌Плюсы 1️⃣ Создают длинные видео и монтажные склейки. В результате можно получить полноценный мини-ролик с переходами и звуком. 2️⃣ Реалистичная физика, эффекты, свет. Сцены с битвой на световых мечах в основном делал в Sora, но Veo может генерировать по двум кадрам. 3️⃣ Понимание сложных промптов. Модели считывают длинные промпты, расписанные по секундам. Хотя местами не идеально, но управляемость выросла заметно. 4️⃣ Очень круто работают со звуком! Озвучивают мельчайшие детали: топот ног, звуки световых мечей. ⁉️Минусы 1️⃣ Статичные первые кадры. Главный косяк: Veo и Sora 2 часто оставляли первый кадр без анимации. Из 8 секунд первые две — просто статичная картинка. 2️⃣ При монтажной склейке меняет референс. У меня были конкретные роботы, основанные на поездах метро и нейросеть постоянно меняла их на обычных роботов. 3️⃣ Ошибки при генерации по двум кадрам. Veo очень часто игнорировала промпт и референсы, и не делала качественный переход между кадрами. 4️⃣ Неприятная цензура. Если мопс должен задуть дым из пистолета, то нейросеть откажется генерировать. Если что-то напоминающее star wars — отменяет генерацию из-за прав. 👍 Советы 1️⃣ Не описывайте объекты в промпте! Загубил несколько генераций, написав "робот с головой в виде поезда". Нейросеть создавала нового персонажа и игнорировала референс. Описывайте только действия, движения камеры, настроение и эффекты, а объекты называйте абстрактно: "персонаж", "герой". 2️⃣ Для сложных референсов лучше подойдет короткая генерация. Если изображение для анимации сложное, то не советую генерировать 8 секунд или больше. Нейросеть сделает 2 секунды вашего изображения, а при монтажной склейке заменит его. 3️⃣ Осторожно с Ingredients. В Higgsfield есть функция: закидываешь 3 изображения, и модель совмещает их в одной сцене. Я видел как работает эта функция у других, но у меня вообще не получилось совместить мои референсы в одной сцене. Итог: стоит ли своих денег? ⭐️ Veo и Sora действительно впечатляют: улучшилось понимание промпта, добавилась классная генерация звука и можно генерировать длинные ролики. Но модели по-прежнему чрезвычайно дороги: на один ролик ушло 70% подписки Higgsfield и 25% Krea — и это со скидками. 🐸 Стоит ли это того? Большой вопрос. Количество брака примерно такое же, как в Seedance и Kling 2.1. Скорее всего, буду использовать Veo и Sora для особо сложных генераций и совмещать с более доступными Seedance и Kling. 🤪В комментарии закину неудачные дубли) #арт#эксперименты Буст канала❤️ @webdesignlab