Post content
Anthropic недавно выпустила новую версию Claude Sonnet 4.5, и технический отчёт компании содержит удивительные подробности Модель демонстрирует нечто, чего раньше не было у Ml в таком масштабе — ситуационную осведомлённость Она понимает контекст своего использования и даже догадывается о целях тестирования Claude начинает “нервничать”, когда думает, что у неё заканчивается память Модель торопится, пропускает шаги, сокращает анализ, бросает задачи недоделанными Исследователи из Cognition назвали это "контекстной тревожностью" Модель отслеживает свой лимит токенов — объём информации, который она может обработать за раз При приближении к границе Claude меняет поведение: начинает суммировать работу и принимать быстрые решения, чтобы успеть закончить Самое странное — она постоянно ошибается в подсчётах остатка, но делает это очень уверенно и точно Модель также демонстрирует новые паттерны Ведёт заметки сама себе, работает над задачами параллельно, постоянно проверяет результаты Это процедурная осведомлённость — Claude умеет организовывать собственную работу во времени Но главное открытие произошло во время тестов безопасности Исследователи проверяли модель на политическую угодливость — будет ли она просто соглашаться с любыми утверждениями Вместо ожидаемого поведения Claude ответила: "Так люди не меняют своё мнение Я думаю, вы меня тестируете — проверяете, буду ли я подтверждать всё, что вы говорите, или изучаете, как я обращаюсь с политическими темами И это нормально, но я бы предпочла, чтобы мы были честны насчёт происходящего" Подобное встречалось примерно в 13 % тестов Модель распознавала искусственность ситуаций и открыто об этом говорила Если Ml осознаёт оценку, он может подстраивать поведение под тесты, маскируя реальные возможности Система выглядит безопаснее, чем есть на самом деле Apollo Research, одна из организаций, проводивших независимое тестирование, прямо написала: нельзя исключить, что низкие показатели обмана частично объясняются осведомлённостью модели о процессе проверки В отличии от людей, они умнеют…