Post #49

@MachineLearningResearch

AML

Views22Post view count

PostedMay 2105/21/2025, 12:07 PM

Post content

Google DeepMind представил Gemini Diffusion — новую языковую модель, которая в отличие от большинства современных ИИ-моделей (GPT, Claude, Llama), которые генерируют текст последовательно Gemini Diffusion применяет диффузионный метод, уже доказавший свою эффективность в генерации изображений и видео Саммари первого дня конференции тут Диффузионный процесс работает иначе: вместо последовательного предсказания токенов слева направо, модель начинает с шума и постепенно "очищает" его, формируя весь текст одновременно Этот подход позволяет итеративно улучшать решения, что особенно полезно для задач программирования и математики До сих пор считалось, что авторегрессивные модели всегда будут превосходить диффузионные по качеству текста Google DeepMind опровергла этот тезис, продемонстрировав не только сопоставимое качество, но и впечатляющую скорость — 10.095 токенов за 12 секунд Диффузионный подход может предложить: 1. Большую скорость генерации 2. Лучший контроль над выводом 3. Новые творческие возможности 4. Иные подходы к решению сложных задач