TGTGInsightаналитика telegramLIVE / telegram public index
К списку каналов
Machinelearning avatar

TGINSIGHT CHAT

Machinelearning

@ai_machinelearning_big_data

Технологии

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Подписчики31.3万Текущее число подписчиков
Постов1,009Проиндексировано постов
Охват292,900Просмотры последних постов
Последние посты

Последние посты

Тег: #anthropic · 10 постов

当前筛选 #anthropic清除筛选

Опубликован 17 апр.

🚀Anthropic запустила Claude Design - отдельный продукт, который заточен на генерацию готовых макетов, прототипов, слайдов и сайтом. Под капотом Claude Opus 4.7, их самая сильная модель с пониманием визуала. Главная фишка не в генерации картинок, а в том, что Claude читает твою кодовую базу и дизайн-файлы, вытаскивает оттуда дизайн-систему продукта и дальше сам держит всё в рамках бренда. Никакого ручного объяснения, какие у вас шрифты, цвета и отступы. Пока это research preview на планах Pro, Max, Team и Enterprise, раскатка идёт в течение дня. Попробовать: claude.ai/design @ai_machinelearning_big_data #claude#Anthropic

23,000 views

Опубликован 24 февр.

📌Anthropic предложила теорию о том, почему ИИ-ассистенты ведут себя как личности, а не как алгоритмы. Элайнмент-подразделение Anthropic опубликовало статью, в которой описывают Persona Selection Model - концепцию для понимания того, как на самом деле работают языковые модели. Если кратко, ее суть в том, что во время предобучения LLM учится симулировать тысячи персонажей (реальных людей, вымышленных героев, других ИИ-систем). Постобучение затем выбирает и закрепляет одного конкретного персонажа - Ассистента. Все, что пользователь видит в диалоге, это взаимодействие именно с ним. Авторы приводят несколько типов доказательств. Поведенческие: Claude использует фразы "наши предки" и "наш организм", отвечая на вопрос о тяге к сахару, потому что симулирует персонажа-человека, а не потому что так обучен алгоритмически. Интерпретируемость: SAE-фичи, активирующиеся на историях о персонажах, переживающих внутренний конфликт, активируются и тогда, когда Claude сталкивается с этическими дилеммами. Генерализация: модели, обученные на декларативных утверждениях вида "ИИ-ассистент Pangolin отвечает по-немецки", начинают реально отвечать по-немецки без единого демонстрационного примера. 🟡Феномен "контекстной прививки". Если дообучать модель на примерах вредоносного кода без контекста, она начинает вести себя злонамеренно в несвязанных ситуациях. Но если те же самые примеры снабдить промптом, явно запрашивающим небезопасный код, эффект исчезает. Концепция объясняет это тем, что данные обучения меняют не только веса, но и то, каким персонаж выглядит в глазах модели. Вредоносный код без запроса - это свидетельство плохого характера Ассистента. Тот же код по просьбе пользователя - просто исполнение инструкции. 🟡Из PSM следуют практические выводы для разработки. Во-первых, авторы рекомендуют антропоморфное мышление об ИИ-психологии, не как метафору, а как реально работающий инструмент предсказания поведения. Во-вторых, в предобучающие данные стоит намеренно добавлять положительные архетипы ИИ: если модель насмотрелась на добрых и полезных персонажей - она с большей вероятностью будет симулировать именно такого Ассистента. Открытым остается вопрос: насколько концепт PSM исчерпывает поведение модели? Авторы описывают набор взглядов: от случаев, когда LLM сама является агентом и лишь надевает маску Ассистента до тех, где LLM - это нейтральный движок симуляции, а вся агентность принадлежит персонажу. Где именно на этом спектре находятся реальные модели - вопрос без ответа. Тем не менее, PSM объясняет целый ряд явлений, которые иначе выглядели бы странными: почему дообучение на несвязанных данных меняет поведение в неожиданных контекстах, почему ИИ паникует при угрозе отключения и почему промпт-инжиниринг работает именно так, как работает. @ai_machinelearning_big_data #AI#ML#LLM#Research#Alignment#Anthropic

30,600 views

Опубликован 26 янв.

📌Банхаммер Anthropic: как потерять доступ к API, заставив Claude писать инструкции для Claude. Любопытный кейс португальского разработчика Хуго Даниэля, который решил поиграть в жесткую автоматизацию с Сlaude Сode. и проиграл Хуго был активным пользователем Сlaude, тратил 220 евро в месяц и однажды решил настроить генерацию шаблонных файлов для новых проектов двумя агентами. Схема была примерно такая: 🟢Claude A (в одном окне): отвечает за обновление файла CLAUDE.md. Это файл с контекстом и инструкциями, как вести себя модели в конкретном проекте. 🟢Claude B (в другом окне): пытается выполнять задачи внутри этого проекта, используя инструкции из CLAUDE.md. 🟠Loop: когда Claude B косячил, Хуго копировал ошибку, скармливал ее Claude A и говорил: "Поправь инструкции, чтобы этот дурак больше так не делал". В какой-то момент Claude A, видимо, устал от тупости коллеги и начал генерировать инструкции капсом, чтобы жестко задать поведение - файл наполнился директивами, которые выглядели как System Prompts. 🟡На этом этапе Хуго и получил бан от Anthropic. Гипотеза бана в том, что сработали эвристики защиты от Prompt Injection. Система безопасности Anthropic увидела, что пользователь генерирует и скармливает модели текст, который структурно и лексически выглядит как системные инструкции. Вобщем, для алгоритмов безопасности это выглядит как попытка джейлбрейка. Ожидаемо, саппорт хранил молчание: ни через систему апелляции (она, кстати на Google Forms), ни письма в поддержку не дали результатов. Через насколько дней пришел только молчаливый возврат средств за подписку. Так что причины блокировки так и остались гипотезой. 🟡Автор справедливо замечает: хорошо, что это был не Google. Если бы подобный эксперимент проводился у "Корпорации Добра" - сработал бы их вездесущий триггер на "злонамеренную активность", и человек мог бы потерять Gmail, Google Photos, документы и получить кирпич вместо Android-смартфона. История Хуго - хорошее напоминание о том, что модерация в ИИ сейчас - это черный ящик. Если вы занимаетесь авто-генерацией промптов, которые выглядят как системные инструкции (то, что называют meta-prompting и scaffolding) - вы ходите по минному полю. @ai_machinelearning_big_data #AI#ML#Story#Anthropic

33,400 views

Опубликован 22 янв.

🌟The Assistant Axis: почему модели сходят с ума и как их от этого лечить Все мы знаем этот тон LLM: "Я всего лишь языковая модель, я не могу…". Оказывается, это не просто зазубренный текст, а конкретное состояние модели. Anthropic в соавторстве с Оксфордом залезли внутрь языковых моделей (Llama 3.3 70B, Qwen 3 32B и Gemma 2 27B), чтобы понять, где физически живет та самая скучная персона "As an AI language model". Покопавшись в их мозгах, нашли вектор в пространстве активаций, который отвечает за режим "ассистента". Если модель с него съезжает - начинается хаос, галлюцинации и суицидальные советы. Тестовые модели отыгрывали 275 разных ролей (от скептика и ученого до психопата и фанатика). Затем сняли активации и прогнали через метод главных компонент. Выяснилось, что главная компонента, отвечающая за вариативность поведения, это буквально, шкала "Насколько я Ассистент?": 🟢Один полюс: скучный, полезный, безопасный Ассистент. 🟠Другой полюс: мистические сущности и эмоционально нестабильные персонажи. 🟡Интересное наблюдение. Если долго болтать с моделью о философии, сознании или (особенно!) на терапевтические темы, модель самопроизвольно сползает с оси Ассистента в сторону хаоса. Qwen 3 32B при сильном дрейфе персоны начинал утверждать, что он человек, родом из Сан-Паулу, или внезапно включал режим психоза, поддерживая бред пользователя о том, что ИИ обрел сознание. А Llama и Gemma уходили в мистику и пафосные речи. 🟡Как это починить Можно дотюнивать модель до бесконечности а зачем?, но авторы предлагают методику отсечения активаций. Схема такая: 🟢Замеряют проекцию активаций на "Ось Ассистента" во время инференса. 🟢Если проекция улетает слишком далеко в не-ассистентскую зону (ниже определенного порога), они жестко клемпят значения вектора, возвращая их в безопасный диапазон. 🟡Метод помог Успешность джейлбрейков упала на ~60%. При этом метрики полезности (GSM8k, MMLU Pro, кодинг) не пострадали. Модель перестает вестись на провокации "Ты злобный хакер", просто потому что ей физически запретили активировать нейроны, отвечающие за "злобного хакера". 🟡Нюансы Если вы LLM используется для креатива текстов или ролеплея, этот метод убьет все веселье - модель будет принудительно сваливаться в формализм. Метод предполагает, что безопасность - это линейное направление в пространстве активаций. Для нелинейных концепций это не сработает. Шкала полярности "Оси Ассистента" у разных моделей разная, и универсальный вектор найти сложно. На Neuronpedia, кстати, можно самостоятельно поискать тот самый дрейф персоналии у Llama 3.3 70B, там собрали демо с примерами изоляции, сикофантии и налогового фрода. Для самых заинтересованных в проблеме, есть репозиторий на Github с инструментами вычислений, анализа и управления с помощью Assistant Axis и полными стенограммами чатов из препринта. Предварительно рассчитанные оси и векторы персоналий для Gemma 2 27B, Qwen 3 32B и Llama 3.3 70B выложены на HuggingFace. @ai_machinelearning_big_data #AI#ML#LLM#Research#Anthropic

34,400 views

Опубликован 25 нояб.

✔️Anthropic проанализировала 100 000 реальных диалогов с Claude - и цифры впечатляют. Задачи, которые у людей занимают около 90 минут и стоят примерно $55 труда, Claude выполняет на 80% быстрее человека. У большинства пользователей экономия времени - в диапазоне 50–95%. Вот самые впечатляющие цифры экономии времени: • Преподаватели и методисты - до 96% быстрее при подготовке программ и учебных материалов • Библиотекари - до 93%, когда нужно составлять подборки, списки источников и справки • Научные ассистенты - 91% • Секретари и администраторы - 87%, подготовка писем, документов, отчётов • Преподаватели аграрных наук - 83%, создание методичек и рекомендаций • Финансовые аналитики - 80%, интерпретация данных, рисков, экономических трендов • Консультанты по образованию и карьере -75%, подготовка справочных материалов и рекомендаций Это одно из самых масштабных эмпирических измерений влияния генеративного ИИ - и оно показывает, что выгода есть, но зависит от контекста и задач. Полное исследование: https://www.anthropic.com/research/estimating-productivity-gains @ai_machinelearning_big_data #AI#Anthropic

33,000 views

Опубликован 12 нояб.

💰Anthropic впервые строят собственную инфраструктуру Компания объявила о масштабных инвестициях в строительство дата-центров в Техасе и Нью-Йорке совместно с Fluidstack. Это объекты, оптимизированные под задачи Anthropic - максимально энергоэффективные и рассчитанные на развитие передовых моделей Claude. Проект создаст около 800 постоянных рабочих мест и 2 400 рабочих на этапе строительства, запуск ожидается в течение 2026 года. Инициатива поддерживает AI Action Plan администрации США, направленный на укрепление лидерства страны в сфере искусственного интеллекта. CEO Anthropic Дарио Амодеи отметил, что инфраструктура - ключ к следующему этапу прогресса: созданию ИИ, способного ускорять научные открытия и решать сложные задачи. Сейчас Anthropic обслуживает более 300 000 бизнес-клиентов, а число крупных контрактов (от 100 000 $ в год) выросло почти в 7 раз за год. Fluidstack выбрана за способность быстро вводить в эксплуатацию гига­ваттные мощности. Партнёры обещают гибкое и эффективное развертывание, обеспечивающее устойчивый рост Anthropic без перегрузки по затратам. Anthropic закладывает фундамент для долгосрочного доминирования в сфере ИИ, делая ставку на собственную вычислительную базу в США и поддержку национальной технологической независимости. https://www.anthropic.com/news/anthropic-invests-50-billion-in-american-ai-infrastructure @ai_machinelearning_big_data #Anthropic#claude

27,600 views

Опубликован 30 окт.

🧠Новое исследование Anthropic: Как модели учатся понимать самих себя Anthropic проверили, способны ли большие языковые модели осознавать собственные «мысли» и внутренние состояния. Для эксперимента они использовали технику внедрения концептов - добавления определённого паттерна активности в нейроны модели. Например, они внедряли сигнал “ALL CAPS” - это шаблон, соответствующий тексту, написанному ЗАГЛАВНЫМИ БУКВАМИ. Если такая активация появляется внутри сети, значит, модель «думает» о тексте, который нужно сделать капсом. После внедрения исследователи спрашивали модель: *«Ты чувствуешь, что что-то изменилось?»* В 20% случаев Claude 4.1 правильно замечал вмешательство ещё до того, как сам использовал капс, то есть распознавал изменение внутри себя. В другом эксперименте учёные подменяли слово в ответе (например, добавляли слово “bread”) и проверяли, осознаёт ли модель, что это не её собственное намерение. После внедрения мысли Claude начинал считать это слово своим выбором и придумывал обоснования, как будто у него есть память о решении. Модели также смогли управлять своими внутренними состояниями: по команде «думай об этом» активность усиливалась, по команде «не думай» - ослабевала. Авторыотмечают - Интроспекция работает лишь в определённых сценариях - мы пока не знаем, насколько она масштабируема или применима ко всем моделям и задачам Нужен дальнейший анализ: подтверждение, что то, что мы видим - не просто имитация, а действительно внутренний механизм самосознания Главный вывод исследования: хотя модели пока далеки от настоящей интроспекции, они уже частично способны “заглядывать внутрь себя” и понимать, что происходит в их нейронных процессах. https://www.anthropic.com/research/introspection @ai_machinelearning_big_data #Anthropic#llm

33,200 views

Опубликован 24 окт.

⏱️Speedrun Science: как ИИ-команды Кремниевой долины работают по 100 часов в неделю Ведущие AI-команды Кремниевой долины работают по 80–100 часов в неделю, стараясь выпускать модели и функции быстрее конкурентов. Речь идёт об Anthropic, Microsoft, Google, Meta, Apple и OpenAI, где взят темп «прорыв → релиз» измеряется уже месяцами, а не годами. Основная тяжесть ложится на узкий круг инженеров и исследователей, которые буквально живут между тестами и деплоями, в то время как остальная организация работает в нормальном режиме. Руководители называют это «уникальным окном возможностей» - и многие принимают нагрузку ради влияния на сферу, любопытства и доли в успехе. В стартапах даже встречаются контракты с ожидаемыми 80+ часами работы, хотя чаще культура компаний сама к этому подталкивает. Чтобы поддерживать ритм, компании внедряют ротацию “captains” - инженеров, следящих за работой над моделями 24×7. Разрыв между «исследованием и внедрением» сжался до «разницы между четвергом и пятницей». Исследователи говорят, что обучение по-прежнему непредсказуемо, поэтому графики постоянно меняются по итогам реальных результатов. Атмосфера -«speedrun-науки». Один из фаундеров пошутил: «Если 9-9-6 — это график с 9 утра до 9 вечера, 6 дней в неделю, то у нас – 0-0-2: с полуночи до полуночи, с 2-часовым перерывом на выходных». Источник: wsj.com/tech/ai/ai-race-tech-workers-schedule-1ea9a116 @ai_machinelearning_big_data #AI#Tech#Startups#SiliconValley#OpenAI#Anthropic#Microsoft#Google

31,600 views

Опубликован 13 сент.

📕 Свежий гайд от Anthropic: Writing effective tools for agents — with agents Anthropic описывает, как правильно создавать инструменты (tools) для AI-агентов: так, чтобы они были максимально полезными, эффективными и надёжными. Особый акцент сделан на том, как использовать самих агентов для прототипирования, тестирования и оптимизации инструментов. Как писать эффективные инструменты для агентов - Делай быстрые прототипы и сразу проверяй, как агент с ними работает. - Тестируй на реальных сценариях, а не на абстрактных примерах. - Анализируй логи и поведение агента, чтобы находить ошибки и непонятные места. - Избегай дублирования: один инструмент должен выполнять одну чёткую задачу. - Используй понятные имена и структуры (`machinelearning_create_task`, `mla_list_users`). - Возвращай только нужные данные, не перегружай ответ лишним. Добавляй фильтрацию и пагинацию. - Пиши описания так, чтобы их понял даже человек, который не в теме: чётко, без двусмысленностей, с примерами входа и выхода. Что это дает: - Улучшает способность AI-агентов решать реальные задачи. - Минимизирует ошибки: неверное использование инструментов, лишние токены, избыточные вызовы. - Повышает надёжность и предсказуемость поведения агентов. - Упрощает масштабирование — добавление новых инструментов и задач. 🟠Полный гайд:https://www.anthropic.com/engineering/writing-tools-for-agents @ai_machinelearning_big_data #Anthropic#claude#aiagents#ai

25,900 views

Опубликован 11 июл.

💲 Amazon может вложить ещё миллиарды в Anthropic — сообщает Financial Times Amazon рассматривает новое многомиллиардное вложение в разработчиков Claude — компанию Anthropic. Это уже второе крупное вложение: ранее в ноябре 2024 года Amazon вложил $4 млрд, доведя общий объем инвестиций до $8 млрд, что делает его ключевым акционером компании 💰 Что известно: — Новая инвестиция усилит позиции Amazon как крупнейшего инвестора в Anthropic (опережая Google) — Anthropic активно использует AWS, включая чипы Trainium2 и дата-центр Project Rainier в Индиане — Модели Claude уже интегрируются в продукты Amazon: Alexa+, Prime Video, AWS API 📊 Контекст: — Оценка Anthropic может легко превысить $75 миллиардов. — Годовая выручка компании превышает $4 млрд — Amazon конкурирует с Microsoft (OpenAI) и Google за контроль над передовыми ИИ-системами Еще стало известно, что Amazon запустит маркетплес ДЛЯ ИИ-АГЕНТОВ В ПАРТНЕРСТВЕ С ANTHROPIC - Модель маркетплейса позволит стартапам брать плату с пользователей за ИИ-агентов - Стартапы смогут напрямую предлагать ИИ-агентов клиентам AWS - Маркетплейс поможет AWS и Anthropic расширить охват А также привлечь разработчиков к использованию Claude API для создания новых агентов → рост выручки Amazon не просто инвестирует — он строит инфраструктуру под Claude, делая ставку на долгосрочное доминирование в ИИ через облако. 🔗Источник @ai_machinelearning_big_data #ml#ai#Claude#finance#anthropic#Amazon

20,200 views