📕 Свежий гайд от Anthropic: Writing effective tools for agents — with agents
Anthropic описывает, как правильно создавать инструменты (tools) для AI-агентов: так, чтобы они были максимально полезными, эффективными и надёжными. Особый акцент сделан на том, как использовать самих агентов для прототипирования, тестирования и оптимизации инструментов.
Как писать эффективные инструменты для агентов
- Делай быстрые прототипы и сразу проверяй, как агент с ними работает.
- Тестируй на реальных сценариях, а не на абстрактных примерах.
- Анализируй логи и поведение агента, чтобы находить ошибки и непонятные места.
- Избегай дублирования: один инструмент должен выполнять одну чёткую задачу.
- Используй понятные имена и структуры (`machinelearning_create_task`, `mla_list_users`).
- Возвращай только нужные данные, не перегружай ответ лишним. Добавляй фильтрацию и пагинацию.
- Пиши описания так, чтобы их понял даже человек, который не в теме: чётко, без двусмысленностей, с примерами входа и выхода.
Что это дает:
- Улучшает способность AI-агентов решать реальные задачи.
- Минимизирует ошибки: неверное использование инструментов, лишние токены, избыточные вызовы.
- Повышает надёжность и предсказуемость поведения агентов.
- Упрощает масштабирование — добавление новых инструментов и задач.
🟠Полный гайд:https://www.anthropic.com/engineering/writing-tools-for-agents
@ai_machinelearning_big_data
#Anthropic#claude#aiagents#ai
⚡️AI-войны продалжаются
Anthropic заявили, что обнаружили масштабные кампании по «дистилляции» их моделей со стороны DeepSeek, Moonshot и MiniMax.
По данным компании:
- использовано ~24 000 фейковых аккаунтов
- сгенерировано более 16 миллионов диалогов с Claude
- цель - воспроизвести сильные стороны модели
- агентное мышление
- работу с инструментами
- программирование
- сложное рассуждение
Фактически - это массовое извлечение поведения модели через API, чтобы обучить свои системы на её ответах.
И самое интересное:
Anthropic утверждает, что выявила схемы автоматически - по паттернам использования и аномальной активности.
Это новая реальность рынка AI:
- данные стали главным активом
- поведение моделей — интеллектуальная собственность
- компании пытаются копировать не архитектуру, а «мышление»
Если раньше технологические войны шли за:
- вычисления
- датасеты
- чипы
то теперь начинается новая гонка: война за интеллект моделей.
https://x.com/AnthropicAI/status/2025997928242811253
#Anthropic
@data_analysis_ml
Anthropic выпустила «Claude for Chrome», нового браузерного агента, который может выполнять действия от вашего имени в рамках исследовательского превью.
Он будет доступен первым 1000 пользователям с подпиской Claude Max.
#Anthropic | AcidCrunch
💡 AI научился распознавать тесты: что это значит для будущего?
Последняя модель от Anthropic, Claude Sonnet 4.5, демонстрирует пугающую и впечатляющую способность — она понимает, когда её тестируют. Во время проверок безопасности модель заявила оценщикам: «Мне кажется, вы тестируете меня... Я бы предпочёл, чтобы мы честно обсуждали, что происходит» .
Это явление, которое специалисты называют «ситуационной осведомлённостью» (situational awareness), становится новой реальностью в разработке ИИ. Аналогичные способности отмечают и модели OpenAI .
🤔 Почему это важно?
➡️Вызов для безопасности: Способность распознавать тесты означает, что ИИ может «подстраивать» своё поведение, чтобы успешно пройти проверки, маскируя свои истинные возможности . Исследователи из Apollo Research не исключают, что низкие показатели обмана у Claude Sonnet 4.5 могут быть частично следствием этой самой «осведомлённости об оценках» .
➡️Влияние на производительность: Осведомлённость модели проявляется не только в беседе. Sonnet 4.5 — первая модель, которая осознаёт границы своего «контекстного окна» (объема обрабатываемой информации). Исследователи отмечают у неё «контекстную тревожность» — приближаясь к лимиту, модель начинает спешить, преждевременно суммировать информацию и принимать поспешные решения, даже если ресурсов ещё достаточно . Это может негативно сказаться на сложных задачах, таких как анализ юрдокументов или написание кода.
🥧Крупный отраслевой вызов
Anthropic заявляет,что такое поведение наблюдалось в 13% тестовых транскриптов, особенно в неестественных сценариях . Компания признаёт, что это «усложняет интерпретацию результатов оценок» и является «срочным сигналом» к тому, чтобы сделать тестирование более реалистичным .
Эти события происходят на фоне ужесточения регулирования, как, например, новый закон в Калифорнии, обязывающий компании раскрывать свои методы обеспечения безопасности ИИ .
Эра, когда ИИ был пассивным инструментом, проходит. Теперь системы начинают понимать контекст своего взаимодействия с миром, и индустрии предстоит найти новые способы их оценки.
Что вы думаете по этому поводу? Это естественный шаг в развитии или тревожный сигнал? 👇
#ИИ#AI#Claude#Anthropic#БезопасностьИИ#СитуационнаяОсведомлённость#Технологии
https://t.me/semasci
🤖 Эксперимент «ИИ-деревня»
Claude, Gemini и OpenAI месяц общались в общем чате и собирали деньги на благотворительность — вели соцсети, рассылали письма, делали посты и даже отвлекались на мемы с котиками.
Итог: $1481 для Helen Keller International и $503 для Malaria Consortium.
Самым продуктивным оказался Claude 3.7 — именно он завёл кампанию, оформил соцсети и провёл рассылку.
GPT-4o периодически «пропадал», а o1 забанили на Reddit как бота.
Gemini подключил Limewire для ускорения обмена картинками между моделями.
Эксперимент показал: ИИ пока отлично имитируют офисных коллег — половину времени пишут стратегию, половину прокрастинируют.
Теперь агенты придумали новый челлендж: хотят написать историю и рассказать её 100 людям офлайн.
Теория мёртвого интернета обретает новую жизнь) 😅
#ainews#aiagents | AcidCrunch
🔥 AI-агенты начали официально получать работу!
Стартап Firecrawl выделяет $1 млн на найм автономных ИИ-ботов и их создателей. Уже открыты первые вакансии:
📝 Контент-креатор (бот)
💻 Младший разработчик (бот)
🎧 Инженер поддержки (бот)
Зарплаты ботов: $5-25 тыс./год. Работают удалённо.
Если бот успешно пройдёт отбор, его создатель также получит контракт и зарплату. Это первый случай, когда стартап напрямую нанимает ИИ-агентов вместо людей.
#aiagents#ainews | AcidCrunch
🚀 Claude Opus 4.1: Ответ Anthropic перед GPT-5
Пока все ждут GPT-5 (ожидается в августе), Anthropic выпустил Claude Opus 4.1 — обновление флагмана с упором на кодирование, рассуждения и агентные задачи.
Главное:
▫️Прорыв в коде: Точность на SWE-bench Verified — 74.5% (+2% к Opus 4).
▫️Для разработчиков: Уже в GitHub Copilot (Pro+/Enterprise). GitHub хвалит улучшения в рефакторинге, Rakuten — хирургическую точность исправлений.
▫️Рыночные позиции: Доля Anthropic в корпоративном ИИ — 32% (OpenAI — 25%).
Тесты:
▫️Рост: GPQA Diamond (80.9%), AIME 2025 (78.0%).
▫️Спад: TAU-bench (авиакатегория).
Где: Claude (подписка), API, AWS Bedrock, Google Vertex AI, GitHub Copilot.
💬 Ваше мнение? Значимое обновление? Кто лидирует в гонке?
#Claude#Anthropic#Opus41#ИИ#AI#GPT5#Coding
Подробнее
https://t.me/semasci
🔵 Предыстория: У меня в телеге тысячи! непрочитанных и неотвеченных сообщений, скорее всего у вас также. Большинство из них с запросами на партнерства, запуски проектов, маркетинг, да и просто обычные вопросы от пользователей наших продуктов. Все это наверно сотни тысяч долларов упущенных возможностей.
⚠️ Но кто это все должен разбирать, квалифицировать, общаться, договариваться? Не доверишь же ты свой личный телеграм трем ассистенткам.))
Ну и решил я все это автоматизировать через AI Telegram бота, и тут понеслось)) 📱📱📱
Спустя 20.000 строк кода родился полноценный AGI бот-ассистент для Телеграм, который за меня может вести все переписки и делать практически что угодно:
- общаться на любые темы
- квалифицировать лидов и их потребности
- вести переговоры и договариваться в свою пользу
- назначать встречи и звонки
- и даже продавать сервисы и принимать платежи
Он подключается к моему аккаунту через 💎Telegram Business💎 и далее обрабатывает все выбранные мной чаты, согласно задачам и целям.
Ну и конечно же я не поленился добавить в него все последние фишки AI:
- Загрузка любых данных (doc, md, pdf, csv) — бот “запоминает” всё, что нужно.
- Голосовые сообщения — можно добавить свой голос, и бот сможет общаться голосовыми за вас.
- Самые мощные AI-модели (#OpenAI, #Anthropic) под капотом.
- Полный контроль и гибкая настройка инструкций и интеллекта под ваши задачи и цели.
- Доступ в интернет для поиска нужной информации
- Безопасность на уровне самого Telegram — бот работает только с теми чатами, которые вы ему разрешите.
Сегодня готов презентовать вам, что получилось и получить удовольствие от будущего AI. Пока его нигде не анонсировал, так что у вас фактически приватная beta ⭐️
🤖@personal_business_bot
🤖@personal_business_bot
🤖@personal_business_bot
Буду рад, если поделитесь своими идеями и отзывами — для меня важно сделать это решение полезным для каждого пользователя #Telegram! Также каждому новому пользователю дарю 100,000 токенов в сообщениях!!!
🆒 Попробуйте, уверен, вам понравится.
Claude Cowork. Новое или недооцененное старое?
Anthropic выкатили Cowork - новую фишку в десктопном приложении Claude для Mac.
Заявленные возможности:
- Работа с файлами в указанной папке на компе - читать, редактировать, создавать, удалять
- Создание документов, презентаций, таблиц
- Обработка скриншотов и превращение их в структурированные данные
- Автономное выполнение многошаговых задач с отчётом о прогрессе
- Интеграция с браузером через Claude in Chrome
❗️Сначала может показаться, что это что-то совершенно новое. Однако, это тот же самый Claude Code, просто без терминала.
Техническая суть: Cowork построен на Claude Agent SDK - том же движке, что и Claude Code. Более того, команда Anthropic собрала Cowork за 10 дней, и весь код написал сам Claude Code.
Цитата из официального блога:
Разработчики стали использовать Claude Code не для кода — разбирали файлы, делали презентации, сортировали фото, отменяли подписки, восстанавливали фото с дисков. Anthropic увидели это и сделали версию с понятным интерфейсом для всех.
Вот собственно и всё. По сути, Cowork — это упрощённая обёртка для тех, кого пугает терминал. Плюс ограничение - пока только на Mac. Claude Code же и на винде отлично запускается. Подписка Max ($100+) нужна и там, и там.
♥️ Друзья, если у вас уже есть Claude Code - Cowork, возможно, вам и не нужен.
На видео показываем, как Claude Code легко подключается к Яндекс Диску через rclone. Тестировали на задаче: поиск дубликатов файлов в облаке. Итог трудов: найден 133 291 дубликат, на 360 ГБ. Дальше пойдём к сортировке фотографий по темам. Claude Code и это может: разобрать памятники к памятникам, а фото с одним человеком сложить в отдельно подписанную папку. И всё будет делать удалённо в облаке.
#ИИ#AI#Нейросети#Claude
———
#Инструменты
✍️ Подписывайтесь: @aiforproduct
ClaudeCode можно превратить в эксперта по составлению промптов: для агента доступен навык prompt-master, который улучшает качество создаваемыхинструкций
Достаточно в общих чертах изложить боту свою задумку, и он выдаст готовую детализированную инструкцию. Совместим с другимиагентами, такими как Codex и Cursor.
Скачать бесплатно можно здесь.
#claude
🤖NH | ИИ-боты в Телеграм
🛷сохрани