Post content
Anthropic выпустили Opus 4.1 и выяснили ещё больше о том, как Mlрассуждают - новое исследование Вчера Anthropic присоединились к параду релизов и выпустили Opus 4.1, который стал еще лучше для кодирования и агентских задач Вчера OpenAI представили свою опен сорс модель А Google - Genie3 Более того, международная группа исследователей из Anthropic, Decode, EleutherAI, Goodfire AI, Google DeepMindопубликовала масштабное исследование внутренних механизмов больших языковых моделей Что выяснили? 1. Языковые модели используют многоэтапное мышление даже в простых задачах 2. Модели сначала решают задачи на универсальном уровне, а потом переводят на конкретный язык 3. У моделей есть специализированные "детекторы" для отслеживания грамматических структур, границ предложений и даже отдельных букв — особенно важно для рифм и акронимов Исследователи разработали "графы атрибуции" — способ визуализировать информационные потоки внутри модели Это как МРТ для Ml: можно увидеть, какие части "мозга" активны при решении конкретной задачи Методы оказались воспроизводимыми на разных моделях (GPT-2, Gemma, Llama) и уже используются сообществом — создано более 7000 таких "снимков мозга" Ml Для математических задач модели используют заготовленные паттерны для конкретных комбинаций входных данных Это объясняет, почему Ml иногда неожиданно ошибается в, казалось бы, простых вычислениях Появляется возможность точечно настраивать поведение моделей, предсказывать их ошибки и создавать более надежные системы