Post #1724

@ai_volution

ИИволюция 👾

Просмотры3,700Количество просмотров

Опубликован18 февр.18.02.2026, 05:56

Содержимое поста

Содержимое

Sonnet 4.6 Недели 2 назад ходили слухи о скором выходе Sonnet 5, но пока нам выкатили Sonnet 4.6. Скорее всего не было потребности выпускать Sonnet 5 раньше обновлений конкурентов и просто придерживают монстра в клетке. Полный апгрейд по кодингу, computer use, работе с длинным контекстом, агентному планированию и дизайн задач. Сразу стал дефолтом в Free и Pro тарифах. Бенчмарки: На 11 из 16 видах тестов Sonnet 4.6 обходит даже старый Opus 4.5. – ARC-AGI-2 (нестандартные задачи): 58.3% против 13.6% у Sonnet 4.5 и 37.6% у Opus 4.5 – BrowseComp (агентный поиск): 74.7% против 43.9% у Sonnet 4.5 и 67.8% у Opus 4.5 – Office tasks GDPval-AA: 1633 против 1276 у Sonnet 4.5 и 1416 у Opus 4.5. – Finance Agent: 63.3% против 54.5% у Sonnet 4.5 и 58.8% у Opus 4.5. – Computer use OSWorld: 72.5% против 61.4% у Sonnet 4.5 и 66.3% у Opus 4.5. – Terminal-Bench 2.0 (агентный кодинг в терминале): 59.1% против 51.0% у Sonnet 4.5. Opus 4.5 чуть выше - 59.8% – SWE-bench Verified (реальные задачи на GitHub): 79.6% против 77.2% у Sonnet 4.5. Opus 4.5 - 80.9% Цена $3/$15 за млн токенов, т.е. осталась без изменений, какая была у Sonnet 4.5. Доступен на всех планах Claude, в Claude Code, API и облачных платформах. Free тир обновили до Sonnet 4.6 по умолчанию. Доступен контекст 1M токенов (бета), но только при оплате по токенам через API и в СС включении трат за токены (в подписке недоступен). Как пишут Антропики, Sonnet 4.6 подходит для большинства повседневных задач: фронтенд, многошаговые задачи, работа с документами и финансовым анализом. Рекомендуют попробовать Sonnet 4.6 с разными уровнями thinking, чтобы найти баланс скорости и качества под свои задачи. Opus 4.6 оставить для рефакторинга больших кодовых баз, координации нескольких агентов и задач, где цена ошибки высока. Я до этого вообще всё делал с Opus 4.6, но кажется простые задачи теперь надо делегировать на Соннет 4.6 и оркестрировать теперь эти модели. Не люблю это, всегда забывается про выбор модели перед запуском конкретной задачи, и скорее всего так и буду сидеть на опусе 4.6 Подробнее в блоге Антропик: https://www.anthropic.com/news/claude-sonnet-4-6