Post content
NVIDIA и Georgia Tech утверждает, что будущее агентного ИИ за малыми языковыми моделями (SLMs) Основная идея - для большинства повторяющихся специализированных задач огромные модели избыточны SLMs, которые помещаются на обычный компьютер, могут эффективнее справляться с рутинными операциями, экономя ресурсы и деньги Исследователи создали бенчмарк на основе соревнования по ускорению обучения GPT-2, где сообщество сократило время с 45 до 3 минут В результате даже лучшие модели (o3-mini, Claude 3.7, Gemini-2.5-Pro, DeepSeek-R1) восстанавливают менее половины улучшений, даже когда им дают подробные инструкции Исследователи выявили несколько ключевых проблем: - Агенты часто не могут правильно реализовать даже описанные изменения - Сложности с пониманием и применением новых техник - Проблемы с отладкой собственного кода - Трудности с оптимизацией производительности Получается, если большие модели не справляются с воспроизведением кода, как могут справиться малые? Ответ в типах задач NVIDIA говорит о простых повторяющихся операциях, а Meta тестирует сложное научное программирование с отладкой и оптимизацией Это разные миры сложности 1. Специализация работает, узкие модели для узких задач могут быть эффективнее универсальных 2. Автономность далека, даже с подробными инструкциями ML пока не может надёжно программировать 3. Будущее гибридное, вероятно, увидим системы из множества специализированных моделей разного размера Эти работы показывают, что путь к полноценным ML-агентам будет постепенным Экономическая оптимизация через SLMs имеет смысл, но не стоит ожидать прорывов в сложных творческих задачах Рекурсивное самоулучшение ИИ — это не внезапный скачок, а процесс, который уже идёт От IDE до GitHub Copilot — постепенно автоматизируют всё больше При этом nanoGPT — это всего 750 строк учебного кода, а реальные системы в сотни раз сложнее Специализация неизбежна, но до автономных ИИ-исследователей ещё далеко