TGTGInsightаналитика telegramLIVE / telegram public index
← Machinelearning

TGINSIGHT SIMILAR POSTS

Найти похожее

Источник @ai_machinelearning_big_data · Post #8369 · 26 авг.

🚀 Wan2.2-S2V — модель с 14 миллиардами параметров для генерации видео кинематографического качества на основе аудио. 🎬 Новая версия Wan способна превращать статичные изображения и аудио в динамичные видео с реалистичными выражениями лиц, естественными движениями тела и профессиональной работой камеры. ✨Ключевые особенности: - Высокая динамическая согласованность — модель генерирует плавную и устойчивую анимацию на протяжении всего видео - Высокое качество аудио-видео синхронизации — точное соответствие мимики и артикуляции звуку - Контроль движения и среды через текстовые промпты — возможно задавать жесты, эмоции, фон и поведение персонажа (например, человек «идёт по рельсам», «девочка поёт под дождём», «старик играет на пианино у моря») - Поддержка сложных сценариев — включая движение камеры, дождь, ветер, парашют, съёмку в движущемся поезде и другие кинематографические эффекты 🖼️ + 🎵 = 🎥 Wan2.2-S2V принимает на вход одно изображение и аудиофайл, а на выходе создаёт синхронизированное видео, соответствующее заданному промпту. 📊По результатам тестов модель демонстрирует лучшие или близкие к лучшим показатели среди конкурентов: - FID ↓ 15.66 — высокое качество видео - EFID ↓ 0.283 — естественность выражения лица - CSIM ↑ 0.677 — сохранение идентичности персонажа - Хорошие результаты на SSIM, PSNR и Sync-C подтверждают визуальную чёткость, стабильность и аудиосинхронизацию 🔓Проект полностью открытый — исходный код, веса модели. И судя по всему, что модель совместима с LoRA-адаптерами от Wan 2.x 🟢Попробовать онлайн: https://wan.video 🟢GitHub: https://github.com/Wan-Video/Wan2.2 🟢Проект: https://humanaigc.github.io/wan-s2v-webpage 🟢Декма на Hugging Face: https://huggingface.co/spaces/Wan-AI/Wan2.2-S2V 🟢Демо на ModelScope: https://modelscope.cn/studios/Wan-AI/Wan2.2-S2V 🟢Веса: https://huggingface.co/Wan-AI/Wan2.2-S2V-14B @ai_machinelearning_big_data #AI#ML#Wan

Hashtags

Результаты

Найдено 14 похожих постов

Earth&Climate Tech

@earth_climate_tech · Post #401 · 19.10.2023, 16:00

​​Polymathic - междисциплинарный ИИ Ох, какая классная межуниверситетская инициатива - Polymathic🔥. Задача, которую они решают, заключается в создании ИИ моделей, которые используют информацию из наборов данных различных модальностей и разных научных областей, которые не имеют общего представления (например, текста). Такие модели могут использоваться в качестве надежных базовых показателей или можно сделать файн-тьюнинг для конкретных приложений. Такой подход может демократизировать ИИ в науке, предоставляя более сильные априорные модели для общих концепций, таких как причинность, измерение, обработка сигналов, и т.п. В общем история с базовыми и генеративными моделями понемногу адаптируется к научным задачам, за что мы топим тоже 🤘. Реальных проектов пока немного, но есть, например, Multiple Physics Pretraining - подход к разработке больших предобученных физических суррогатных моделей или AstroClip - видимо модель CLIP для астрофизиков. На данный момент кроме команды ученых есть и крутой консультативный совет, например, с Яном Лекуном (Yann LeCun) из Meta AI. #AI#ML

Hashtags

ForgetMe | Нейросети

@forgetmeai · Post #4830 · 27.07.2025, 13:30

⚡️WAN 2.2 выходит в опенсорс уже 28 июля Новая версия видеогенеративной модели WAN 2.2 будет выложена в открытый доступ. Обновление ориентировано на кинематографичную генерацию и креативные сценарии. Прямая трансляция релиза состоится 28 июля в 15:00 по московскому времени (20:00 UTC+8). 🤑ForgetMe | Boosty | ForgetBench | ForgetGPT | ForgetAPI #новости#нейросети#wan#qwen

ForgetMe | Нейросети

@forgetmeai · Post #4842 · 29.07.2025, 09:02

⚡️Qwen представили Wan 2.2 — кинематографическая видеомодель с открытым исходным кодом Qwen выпустили Wan 2.2, и это первая в мире MoE-видеомодель в опенсорсе, способная на генерацию кинематографических видео с 720p/24fps. Что нового: 🟡MoE-архитектура, где диффузионные шаги обрабатываются специализированными экспертами — высокая детализация без перегруза по ресурсам. 🟡Продвинутый контроль сцены — можно задавать освещение, цвет, движения камеры и композицию. 🟡Три версии модели: • wan2.2-t2V-A14B — текст в видео • wan2.2-i2V-A14B — изображение в видео • wan2.2-TI2V-5B — объединённый режим (и текст, и картинка) Сильная сторона Wan 2.2 — анимация сложных движений и реалистичная передача эмоций, что может сильно пригодиться в генерации нарративных видео и короткометражек. 🤖 Попробовать: wan.video/welcome 📄 Код и модели: GitHub | Hugging Face 🤑ForgetMe | Boosty | ForgetBench | ForgetGPT | ForgetAPI #qwen#нейросети#новости#wan

#AI Немного ИИ-теории ❗️В недавнем иске против компании OpenAI Илон Маск утверждал, что GPT-4 является ранним AGI, по сути равным человеческому интеллекту. Что же такое AGI и когда он появится? 👤Сэм Альтман, CEO Open AI определяет AGI (artificial general intelligence) как интеллект, равный уровню обычного человека, который можно было бы принять в команду как сотрудника. Также популярно определение AGI как «системы, способной выполнить любую когнитивную задачу, доступную человеку». 📎Для справки: существует несколько видов (уровней развития) ИИ, а именно узкий ИИ (narrow, ANI), общий ИИ (genreal, AGI) и супер ИИ (super AI, ASI). ⏲Исследователи никак не могут прийти к консенсусу относительно даты появления AGI. По результатам Expert Survey on Progress in AI, существует 50% шанс того, что AGI появится до 2059 года. Тем не менее, поле ИИ изменяется постоянно и становится сложным оставаться в курсе событий. ⭐️Для этого мы нашли крупнейшее русскоязычное AGI-сообщество agirussia.org — у них есть канал и группа в Telegram. 🌐еще проходят еженедельные онлайн-семинары по тематике AGI на русском языке, записи семинаров за последние несколько лет доступны на YouTube и их сообществе в ВК. Держим руку на пульсе ИИ⭐ ⭐️Автор, Анна, @qcuqueen

Hashtags

Earth&Climate Tech

@earth_climate_tech · Post #399 · 17.10.2023, 16:00

Хакатончик от Xeek Two Birds, One Neural Network - так называется новый хакатон от Xeek в области Generative AI. Звучит как-будто нужно сделать свой Dalle-E2, но на самом деле, задача выглядит немного иначе. По условиям хакатона, участникам нужно сделать нейронную сеть, которая максимизирует разнообразие генерируемых результатов, отвечающих двум условиям. Авторы хакатона проводят параллели с добавлением двух геофизических измерений для ограничения сценариев геологических моделей. Буквально, нужно построить нейронную сеть, которая генерирует разнообразные значения x0, x1, сохраняя при этом их природу в виде нисходящих или восходящих прямых линий, удовлетворяющих заданным функциям y1, y2, как показано на картинке. Более подробное описание - тут. Призовой фонд $40К (первое место $19.5K). #hackathon#AI#ML

Илья AGI TV 🤖

@ilia_plasma · Post #567 · 20.08.2024, 05:15

Влияние #AI на жизнь и будущее наших детей неоценимо. Восьмилетняя девочка с помощью cursor создает свой первый сайт.

Hashtags

Илья AGI TV 🤖

@ilia_plasma · Post #491 · 21.04.2024, 15:47

🤔 Эксклюзив. Интервью Павла Дурова. 🆒 Подписывайся @ilia_plasma#AI

Hashtags

Илья AGI TV 🤖

@ilia_plasma · Post #489 · 21.04.2024, 11:43

❤️Интервью Павла Дурова на русском в 4k@durov 🎞 Ссылка на Youtube Решил поиграться с нашим #AI и перевести видео с липсинком полностью через бот @plasma_gpt_ai_bot На русский в разы сложнее переводить, чем на английский. Смотрите, что получилось)

Hashtags

12
НазадСтр. 1 из 2Вперёд