TGTGInsightаналитика telegramLIVE / telegram public index
Содержимое поста
Содержимое
🆕 Новый год, новый обзор на Хабр по AI-security и интерпретируемости от @ivanich_spb В прошлый раз разбирались почему не все джейлбрейки одинаково полезны. На этот раз исследование от Anthropic - как вскрывали "черный ящик" их топ LLM-ки (Claude Sonnet). И бонусом ссылки на сервис, где можно самим порулить поведением опенсорсных моделек. 🚽 Го читать!