Post #655

@MachineLearningResearch

AML

Views602Post view count

PostedFeb 302/03/2026, 12:36 PM

Post content

В работе Anthropic и EPFL исследователи измерили, как именно ошибаются LLM Проверяли на разных задачах: - тесты со множественным выбором, - агентное программирование, - оценки безопасности MlA Паттерн везде одинаковый, чем дольше модель думает, тем более непредсказуемыми становятся её ответы Та же модель на тот же вопрос может дать совершенно разные ответы при повторных запросах - не потому что преследует скрытую цель, а потому что внутренне нестабильна Проверили на семействе Qwen3 (от 1.700.000.000 до 32.000.000.000 параметров) На простых задачах масштаб помогает модели становятся стабильнее На сложных задачах наоборот, крупные модели становятся ещё более хаотичными. Отдельный эксперимент показал почему, модели быстро учатся понимать правильную цель, но гораздо медленнее учатся стабильно её достигать Практический вывод - не полагайтесь на единичные ответы моделей рассуждений для критических решений Ансамблирование, верификация, человеческий контроль - необходимость