Post #1262

@ai_volution

ИИволюция 👾

Просмотры3,690Количество просмотров

Опубликован24 мая24.05.2025, 11:03

Содержимое поста

Содержимое

Claude Sonnet 4 и Opus 4 Claude Opus 4: - Самая мощная модель Anthropic на сегодня - Opus 4 способен самостоятельно работать над задачей 6–7 часов без вмешательства — например, в кейсе Rakuten модель провела полноценный open-source рефакторинг в агентном режиме. Это не про "магическую выносливость", а про устойчивость к сбоям и сохранение фокуса в сложных цепочках, где другие модели просто ломаются. - Превосходит GPT-4.1 и Gemini 2.5 Pro в инженерных задачах Claude Sonnet 4: - Улучшенная версия Sonnet 3.7 - Точнее, быстрее, лучше следует инструкциям - Сохраняет баланс между качеством и скоростью - Доступна бесплатно в claude.ai Текущий фокус Anthropic в развитии моделей — агентные и инженерные задачи, где важны устойчивость, работа с кодом, использование тулов и файлов, а также поддержание долгосрочного контекста. Новые фишки в API: Code Execution Tool, поддержка MCP, Files API для доступа к локальным файлам, а еще можно Prompt Caching увеличить до 1 часа. Что еще интересного: Extended thinking и tool use (пока в бете) Обе модели теперь могут использовать инструменты, например, веб-поиск прямо во время «длительного размышления». Claude умеет переключаться между рассуждением и использованием тулов, чтобы улучшить точность и полезность ответов. Память и работа с файлами Если дать Opus 4 доступ к локальным файлам, он может сохранять важную информацию в memory files и потом использовать её дальше. Это помогает модели лучше помнить контекст, не теряться в длинных задачах и работать надёжнее в агентных сценариях. В пример на демо: во время игры в Pokémon Red модель сама создала навигационный гайд и опиралась на него дальше. Thinking Summaries В Claude 4 появилась новая функция — thinking summaries. Если размышления модели получаются слишком длинными, она автоматически сжимает цепочку reasoning в краткое и понятное резюме. Для этого используется отдельная, меньшая по размеру модель, которая умеет компактно пересказывать ход мыслей основной. Получился очень долгожданный и мощный релиз от Anthropic. И мы попали в бесконечную петлю: одна компания делает мощный релиз, другая перекрывает его своим более мощным, и все эти релизы перебивает третья. И так по кругу 😅 P.S. Немного припозднился с новостью, но лучше написать, чем не написать 😄 О релизе можно почитать в блоге Anthropic.