Post #1777

@ai_volution

ИИволюция 👾

Просмотры2,440Количество просмотров

Опубликован8 апр.08.04.2026, 05:35

Содержимое поста

Содержимое

Anthropic вчера тихо показали Claude Mythos Preview и тут же сказали, что никому его не дадут. Anthropic выложили PDF на 240 страниц с бенчмарками и отчётом о безопасности. Если коротко: на SWE-bench Verified — 93.9% (у Opus 4.6 — 80.8%). На SWE-bench Pro — 77.8% против 53.4% у Opus 4.6 и 57.7% у GPT-5.4. На Humanity's Last Exam — 64.7% с инструментами. На Terminal-Bench 2.0 — 82%. Но самое интересное не в цифрах. Anthropic решили, что модель слишком хороша в кибербезопасности, чтобы выпускать её в открытый доступ. Mythos автономно находит zero-day уязвимости в операционных системах и браузерах и сам пишет эксплойты. Opus 4.6 из сотен попыток смог написать рабочий эксплойт для Firefox дважды. Mythos — 181 раз. Николас Карлини из Anthropic (исследователь безопасности AI): “Я нашёл больше багов за последние пару недель, чем за всю жизнь до этого”. Команда откопала 27-летнюю уязвимость в OpenBSD (баг в TCP SACK валидации), лежавший с 1999 года. Нашли дыры в каждой крупной ОС и каждом крупном браузере. Некоторым из этих уязвимостей по 10-20 лет. Вместо релиза Anthropic запустили “Project Glasswing” — оборонительный проект: модель дают только тем, кто защищает критическую инфраструктуру. В проект вошли AWS, Apple, Microsoft, Google, Nvidia, CrowdStrike, Cisco, JPMorgan, Linux Foundation и ещё 40+ организаций. Грег Кроа-Хартман, второй человек после Линуса Торвальдса в разработке Linux, говорит, что ещё пару месяцев назад от AI приходили мусорные отчёты об уязвимостях, а потом в какой-то момент модели подросли, и пошли действительно настоящие баги. И много! Когда Mythos появится для обычных пользователей неизвестно. Anthropic говорят, что сначала нужны новые защитные механизмы. В общем, по ощущениям не скоро.