TGTGInsightаналитика telegramLIVE / telegram public index
← Machinelearning

TGINSIGHT SIMILAR POSTS

Найти похожее

Источник @ai_machinelearning_big_data · Post #8903 · 30 окт.

🚀 Emu3.5 - новая масштабная мультимодальная world-модель Это World-модель, работающая сразу с двумя потоками - текстом и пикселями и предсказывающая их совместное состояние на каждом шаге. - 🔥 Обучена на 10T+ чередующихся vision-language токенов и доведена RL - в результате модель демонстрирует сильное мультимодальное рассуждение и генерация - ⚡ Новый подход DiDA (Discrete Diffusion Adaptation) —- Discrete Diffusion Adaptation переводит последовательное декодирование в параллельное двустороннее «денойзинг»-предсказание в дискретном пространстве токенов - в итоге это дает примерно 20× быстрее инференс без потери качества. По метрикам модель превосходит Nano Banana в генерации, редактировании и интерливинговых задачах. 🟠Попробовать: Emu3.5: https://emu.world 🟠Github: https://github.com/baaivision/Emu3.5 @ai_machinelearning_big_data #Emu3#MultimodalAI#WorldModel#NextTokenPrediction

Результаты

Найдено 4 похожих постов

Общий глобальный поиск

Machinelearning

@ai_machinelearning_big_data · Post #8903 · 30.10.2025, 12:33

🚀 Emu3.5 - новая масштабная мультимодальная world-модель Это World-модель, работающая сразу с двумя потоками - текстом и пикселями и предсказывающая их совместное состояние на каждом шаге. - 🔥 Обучена на 10T+ чередующихся vision-language токенов и доведена RL - в результате модель демонстрирует сильное мультимодальное рассуждение и генерация - ⚡ Новый подход DiDA (Discrete Diffusion Adaptation) —- Discrete Diffusion Adaptation переводит последовательное декодирование в параллельное двустороннее «денойзинг»-предсказание в дискретном пространстве токенов - в итоге это дает примерно 20× быстрее инференс без потери качества. По метрикам модель превосходит Nano Banana в генерации, редактировании и интерливинговых задачах. 🟠Попробовать: Emu3.5: https://emu.world 🟠Github: https://github.com/baaivision/Emu3.5 @ai_machinelearning_big_data #Emu3#MultimodalAI#WorldModel#NextTokenPrediction

NEWS 鏈新聞-ABMedia

@abmedia_news · Post #23788 · 10.04.2026, 14:01

【🚀AI 人工智慧|智元 GE-Sim 2.0:用 World Model 生成世界,宇樹勁敵將人形機器人推向自我進化 】 #Gesim2#WorldModel#Embodied 📍請見報導: https://abmedia.io/gesim2-0-embodied-ai-world-model 📍訂閱鏈新聞頻道:https://linktr.ee/abmedia.io

BesnowCloud貝雪雲-公告頻道

@besnow_cloud · Post #3249 · 08.06.2025, 08:15

🔊【#深度解读】 📣 当 ChatGPT 还在妙语连珠,李飞飞已经让 AI 睁开双眼,重塑 3D 世界!从空间智能到多元宇宙,下一波技术浪潮正悄然逼近。想抢先一窥 LLM 之后的蓝海?👇 点击长文,一起进入 World Model 时代 #AI#WorldModel#3D智能#李飞飞 👉阅读全文

Machinelearning

@ai_machinelearning_big_data · Post #8256 · 12.08.2025, 17:51

🎮 Matrix-Game 2.0 — первая опенсорс модель, которая генерирует интерактивные 3D-миры из текста в реальном времени Неделю назад DeepMind показала Genie 3, но код не был выложен в открытый доступ. А сегодня Skywork выложили свой генератор Matrix-Game 2.0 миров в опенсорс 🚀 Возможности: 🟢25 кадров/с в реальном времени 🟢Генерирует минуты непрерывного геймплея 🟢Полная интерактивность: движение, повороты, исследование мира Можно использовать несколько встроенных шаблонов: город, дикая природа, TempleRun, GTA и др. Зачем это нужно: 🟠Создание игровых движков 🟠Тренировка AI-агентов 🟠Создание виртуальных персонажей Заявленые требования: GPU с памятью не менее 24 ГБ (A100 и H100 протестированы). Как работает: • Обучена на 1350 часах видео геймлея • Управление: движок реагирует на нажатия клавиш и движение мыши на каждом кадре • Модель: 1,3 млрд параметров • KV-Cache хранит контекст, чтобы окружение генерировалось без ограничений по времени 🟡Huggingface Model: https://huggingface.co/Skywork/Matrix-Game-2.0 🟡 Repo: https://matrix-game-v2.github.io @ai_machinelearning_big_data #AI#MatrixGame#OpenSource#DeepLearning#GameDev#InteractiveAI#WorldModel#GenerativeAI#RealtimeAI#MachineLearning