Post #528

@MachineLearningResearch

AML

Views36Post view count

PostedDec 612/06/2025, 08:52 AM

Post content

Разбор того, как создают и обучают модели, ориентированные на написание кода, и как на их основе строят полноценные софт-агенты Что в нём разбирается: Как формируют модель - Сбор и очистка гигантских датасетов кода - Предобучение: модель впитывает реальные паттерны программирования в промышленных масштабах - SFT и RL: дополнительные этапы, где модель учат лучше следовать инструкциям, проходить тесты и избегать очевидных ошибок Как модели превращают в инженерных агентов - Агент читает баг-репорт или фичу - Планирует шаги - Меняет файлы - Запускает тесты - Повторяет цикл, пока не добьётся результата Какие проблемы всё ещё остаются - Работа с огромными репозиториями - Безопасность и надёжность генерируемого кода - Корректная оценка качества работы агентов - Реальные приёмы и лайфхаки, которые используют текущие команды Исследование - мощный срез состояния индустрии: от датасетов и архитектур до практических инженерных пайплайнов Это именно то, как современные LLM превращаются в «второго разработчика» в команде https://arxiv.org/abs/2511.18538