TGINSIGHT CHAT
Machinelearning
@ai_machinelearning_big_data
ТехнологииПогружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri
Последние посты
Тег: #wan · 2 постов
🚀 Wan2.2-S2V — модель с 14 миллиардами параметров для генерации видео кинематографического качества на основе аудио. 🎬 Новая версия Wan способна превращать статичные изображения и аудио в динамичные видео с реалистичными выражениями лиц, естественными движениями тела и профессиональной работой камеры. ✨Ключевые особенности: - Высокая динамическая согласованность — модель генерирует плавную и устойчивую анимацию на протяжении всего видео - Высокое качество аудио-видео синхронизации — точное соответствие мимики и артикуляции звуку - Контроль движения и среды через текстовые промпты — возможно задавать жесты, эмоции, фон и поведение персонажа (например, человек «идёт по рельсам», «девочка поёт под дождём», «старик играет на пианино у моря») - Поддержка сложных сценариев — включая движение камеры, дождь, ветер, парашют, съёмку в движущемся поезде и другие кинематографические эффекты 🖼️ + 🎵 = 🎥 Wan2.2-S2V принимает на вход одно изображение и аудиофайл, а на выходе создаёт синхронизированное видео, соответствующее заданному промпту. 📊По результатам тестов модель демонстрирует лучшие или близкие к лучшим показатели среди конкурентов: - FID ↓ 15.66 — высокое качество видео - EFID ↓ 0.283 — естественность выражения лица - CSIM ↑ 0.677 — сохранение идентичности персонажа - Хорошие результаты на SSIM, PSNR и Sync-C подтверждают визуальную чёткость, стабильность и аудиосинхронизацию 🔓Проект полностью открытый — исходный код, веса модели. И судя по всему, что модель совместима с LoRA-адаптерами от Wan 2.x 🟢Попробовать онлайн: https://wan.video 🟢GitHub: https://github.com/Wan-Video/Wan2.2 🟢Проект: https://humanaigc.github.io/wan-s2v-webpage 🟢Декма на Hugging Face: https://huggingface.co/spaces/Wan-AI/Wan2.2-S2V 🟢Демо на ModelScope: https://modelscope.cn/studios/Wan-AI/Wan2.2-S2V 🟢Веса: https://huggingface.co/Wan-AI/Wan2.2-S2V-14B @ai_machinelearning_big_data #AI#ML#Wan
🎬 Alibaba опять в ударе, сегодня у нас релиз Wan2.2 Это первая в мире open-source модель генерации видео с архитектурой MoE и полным кинематографическим контролем! 🚀Что внутри: 🔸Первая MoE‑модель для видео — масштабируется без лишней нагрузки. Разные эксперты отвечают за этапы диффузии, работая в команде. 🔸Кинематографический контроль — управляем светом, цветом, движением камеры и композицией прямо из prompt’а. 🔸Полная open-source линейка: - Wan2.2-T2V-A14B — текст → видео - Wan2.2-I2V-A14B — изображение → видео - Wan2.2-TI2V-5B — объединённая генерация 📈 Умеет лучше всех генерировать *сложные движения* и выглядит уже почти как кино 🎥 🟢GitHub: https://github.com/Wan-Video/Wan2.2 🟢Hugging Face: https://huggingface.co/Wan-AI 🟢ModelScope: https://modelscope.cn/organization/Wan-AI @ai_machinelearning_big_data #AI#VideoAI#GenerativeAI#OpenSource#Wan