TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #403 · 31 дек.

С Новым Годом!🎄☃️❄️ Снова этот рубеж подведения итогов и определения планов на следующее 365 дней. Что же мы успели застать в 2к25? 🔸 AI снова делает скачёк в развитии, как по качеству, так и по затратам на ресурсы Продолжая расшатывать все рынки 🔸 Эпичный прорыв цен на железо (из-за первого факта). Сначала оперативка, потом и остальные подтянулись. Успели закупиться вовремя? 🔸 Новый виток "борьбы с интернетом" в РФ Работать всё сложней 🔸 Опенсорсный проект MinIO закрылся Теперь только в облаке и только за денежку Но не всё так плохо! 🔸 Всё больше уверенных мнений, что AI нас не заменит Но всем нужно адаптироваться к новым реалиям и инструментам 🔸 uv ворвался в прод Так и стандартом станет скоро 🔸 Вышел Django 6 Достаточно ли изменений для мажорной версии? 🔸 Вышел PIthon 3.14 с NO-GIL режимом Раньше это считалось невозможным! 🔸 В том же 3.14 мы получили полноценные Субинтерпретаторы и JIT И другие оптимизации 🔸 Язык Rust теперь официально второй язык ядра Linux Хоть и не без проблем 🔸 Проекту pythonotes 6 лет 🎂 Скоро в школу) Мир вокруг меняется постоянно и всё с большей скоростью. Не ищите виновных, просто адаптируйтесь и постоянно учитесь. И всё будет пучком! 😎 Оглядываясь назад в прошлое, задумайтесь, можете ли вы сказать тому себе из прошлого СПАСИБО за то, что вы имеете в настоящем? И хорошенько подумайте в этом настоящем, что нужно делать уже сейчас, чтобы вы из будущего стали лучшей версией себя настоящего и гордились своей версией из прошлого за заботу о будущем. Sir Christopher Edward Nolan :) #offtop

Hashtags

Резултати

Пронајдени 4 слични објави

Пребарај: #videogeneration

当前筛选 #videogeneration清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8417 · 31.08.2025 г., 12:04

💡 Исследователи из ByteDance и Stanford предложили новый метод для генерации длинных видео — Mixture of Contexts. 🔑 В чём проблема: Когда видео становится длинным, внимание модели сильно «раздувается»: растёт стоимость вычислений, модель теряет детали на генерациях, забывает персонажей и «дрейфует». ⚡ Чем интересен Mixture of Contexts: - Видео разбивается на куски (кадры, шоты, подписи). - Каждый запрос выбирает только нужные чанки, вместо того чтобы учитывать всю историю. - Для этого используется простая оценка релевантности: сравнение признаков чанков с текущим запросом. - Обязательно учитываются два «якоря»: полный текстовый промпт и локальный шот для деталей видео. - Causal mask блокирует внимание к будущим кадрам, чтобы не было зацикливаний. - Дальше применяется Flash Attention только к выбранным чанкам — вычисления растут не с длиной всего видео, а только с полезным контекстом. 📊 Результаты: - В 7 раз меньше FLOPs - В 2.2 раза быстрее работа - На длинных сценах (180k токенов) отсекается 85% ненужного внимания 🎥 Итог: - Короткие клипы сохраняют качество - Длинные сцены становятся более плавными, а персонажи — стабильными - Время генерации заметно сокращается Главное: модель учится сама понимать, на что смотреть, получая «память» на минуты видео без изменения базовой архитектуры. 🟠Подробнее @ai_machinelearning_big_data #AI#ML#ByteDance#Stanford#videogeneration

Machinelearning

@ai_machinelearning_big_data · Post #8841 · 23.10.2025 г., 14:57

🎥 Новинка от ByteDance: модель Video-As-Prompt Wan2.1-14B ByteDance выпустила модель Wan2.1-14B, специализирующуюся на задаче *video-as-prompt*, то есть использование видео или комбинации изображений и текста как входных данных для генерации нового видео. - Работает в режимах «видео → видео» или «изображения/текст → видео». - 14 млрд параметров — высокая детализация, плавная динамика, реалистичные движения. - Использует исходное видео как шаблон стиля и композиции. ⚠️ Что стоит учитывать - Модель требует мощных GPU и большого объёма памяти. - Качество результата зависит от сложности запроса и длины видео. 🟠Github: https://github.com/bytedance/Video-As-Prompt 🟠HF: https://huggingface.co/ByteDance/Video-As-Prompt-Wan2.1-14B @ai_machinelearning_big_data #AI#VideoGeneration#ByteDance#Wan2#HuggingFace

Machinelearning

@ai_machinelearning_big_data · Post #8521 · 12.09.2025 г., 07:25

✨HuMo : еще один релиз от ByteDance Модель, ориентированная на создание видео, где главным элементом является человек, с контролем через разные модальности: текст, изображения, аудио. > на входи модель может принимать: текст + изображение, текст + аудио, текст + аудио > поддержка сохранения образа персонажа и синхронизации движений с аудио > модель основана на **Wan 2.1** и Whisper Large v3 https://huggingface.co/bytedance-research/HuMo @ai_machinelearning_big_data #AI#ByteDance#HuMo#VideoGeneration#Multimoda

Machinelearning

@ai_machinelearning_big_data · Post #8854 · 25.10.2025 г., 19:04

⚡️LongCat-Video 13.6И - мощная open-source модель для генерации видео. Модель поддерживает: - Текст в видео (Text-to-Video) - Оживлять картинку (Image-to-Video) - Продолжать существующее видео (Video Continuation) Всё в одном фреймворке, без переключения между разными моделями. 🎬Главное преимущество модели - способность генерировать длинные видео (минуты) без потери качества и цветового дрейфа, что до сих пор остаётся слабым местом большинства аналогов. Еще из интересного, модель позволяет создавать видео в разрешении 720p при 30 кадрах/с. 🏆 LongCat-Video конкурирует с лучшими open-source решениями и даже некоторыми коммерческими моделями, особенно в согласованности текста и изображения. Самое приятное - полный open-source под лицензией MIT, можно использовать как в исследованиях, так и в коммерческих проектах. ▪GitHub: https://github.com/meituan-longcat/LongCat-Video ▪Hugging Face:https://huggingface.co/meituan-longcat/LongCat-Video ▪Сайт проекта: https://meituan-longcat.github.io/LongCat-Video/ @ai_machinelearning_big_data #LongCatVideo#TextToVideo#ImageToVideo#VideoContinuation#OpenSource#AI#GenerativeAI#VideoGeneration