Содержимое
⚡️Anthropic запустила функцию гибридного использования моделей Claude. На Claude Platform новый серверный тул - Аdvisor. Он реализует механику, в которой Sonnet или Haiku идут как исполнитель и ведут задачу от начала до конца, а Opus подключается как советник, чтобы в результате получить качество, близкое к Opus, по цене, близкой к Sonnet. Модель-исполнитель сама решает, когда позвать Opus, он подключается как обычный вызов инструмента. Opus получает выжимку контекста, возвращает план, исправление или сигнал остановки, после чего исполнитель продолжает работу. Советник не вызывает другие инструменты и не пишет в ответ пользователю - только дает указания исполнителю. Все происходит внутри одного запроса, без дополнительных раунд-трипов и ручной оркестрации. Токены советника тарифицируются по его ставкам и репортятся в usage отдельно, так что расход по уровням можно отслеживать. На SWE-bench Multilingual, связка Sonnet + Opus-advisor дает +2,7% к качеству относительно Sonnet в соло и при этом снижает стоимость на 11,9%. На BrowseComp Haiku + Opus-advisor выдает 41,2% против 19,7% у чисто Haiku, а общая стоимость остаётся на 85% ниже, чем если запускать только Sonnet. Advisor tool доступен в бете по API. Документация - тут. Как же Антропик волшебно нарисовала график SWE-Bench 🙂 @ai_machinelearning_big_data #news#ai#ml