TGTGInsightаналитика telegramLIVE / telegram public index

TGINSIGHT SIMILAR POSTS

Найти похожее

Источник @ai_machinelearning_big_data · Post #9421 · 22 янв.

🌟The Assistant Axis: почему модели сходят с ума и как их от этого лечить Все мы знаем этот тон LLM: "Я всего лишь языковая модель, я не могу…". Оказывается, это не просто зазубренный текст, а конкретное состояние модели. Anthropic в соавторстве с Оксфордом залезли внутрь языковых моделей (Llama 3.3 70B, Qwen 3 32B и Gemma 2 27B), чтобы понять, где физически живет та самая скучная персона "As an AI language model". Покопавшись в их мозгах, нашли вектор в пространстве активаций, который отвечает за режим "ассистента". Если модель с него съезжает - начинается хаос, галлюцинации и суицидальные советы. Тестовые модели отыгрывали 275 разных ролей (от скептика и ученого до психопата и фанатика). Затем сняли активации и прогнали через метод главных компонент. Выяснилось, что главная компонента, отвечающая за вариативность поведения, это буквально, шкала "Насколько я Ассистент?": 🟢Один полюс: скучный, полезный, безопасный Ассистент. 🟠Другой полюс: мистические сущности и эмоционально нестабильные персонажи. 🟡Интересное наблюдение. Если долго болтать с моделью о философии, сознании или (особенно!) на терапевтические темы, модель самопроизвольно сползает с оси Ассистента в сторону хаоса. Qwen 3 32B при сильном дрейфе персоны начинал утверждать, что он человек, родом из Сан-Паулу, или внезапно включал режим психоза, поддерживая бред пользователя о том, что ИИ обрел сознание. А Llama и Gemma уходили в мистику и пафосные речи. 🟡Как это починить Можно дотюнивать модель до бесконечности а зачем?, но авторы предлагают методику отсечения активаций. Схема такая: 🟢Замеряют проекцию активаций на "Ось Ассистента" во время инференса. 🟢Если проекция улетает слишком далеко в не-ассистентскую зону (ниже определенного порога), они жестко клемпят значения вектора, возвращая их в безопасный диапазон. 🟡Метод помог Успешность джейлбрейков упала на ~60%. При этом метрики полезности (GSM8k, MMLU Pro, кодинг) не пострадали. Модель перестает вестись на провокации "Ты злобный хакер", просто потому что ей физически запретили активировать нейроны, отвечающие за "злобного хакера". 🟡Нюансы Если вы LLM используется для креатива текстов или ролеплея, этот метод убьет все веселье - модель будет принудительно сваливаться в формализм. Метод предполагает, что безопасность - это линейное направление в пространстве активаций. Для нелинейных концепций это не сработает. Шкала полярности "Оси Ассистента" у разных моделей разная, и универсальный вектор найти сложно. На Neuronpedia, кстати, можно самостоятельно поискать тот самый дрейф персоналии у Llama 3.3 70B, там собрали демо с примерами изоляции, сикофантии и налогового фрода. Для самых заинтересованных в проблеме, есть репозиторий на Github с инструментами вычислений, анализа и управления с помощью Assistant Axis и полными стенограммами чатов из препринта. Предварительно рассчитанные оси и векторы персоналий для Gemma 2 27B, Qwen 3 32B и Llama 3.3 70B выложены на HuggingFace. @ai_machinelearning_big_data #AI#ML#LLM#Research#Anthropic

Hashtags

#ai #ml #llm #research #anthropic

Результаты

Найдено 11 похожих постов

AGIRussia.news (ОИИРоссия.новости)

@agirussianews · Post #2454 · 24.02.2026, 07:41

Похожие Смотреть

⚡️AI-войны продалжаются Anthropic заявили, что обнаружили масштабные кампании по «дистилляции» их моделей со стороны DeepSeek, Moonshot и MiniMax. По данным компании: - использовано ~24 000 фейковых аккаунтов - сгенерировано более 16 миллионов диалогов с Claude - цель - воспроизвести сильные стороны модели - агентное мышление - работу с инструментами - программирование - сложное рассуждение Фактически - это массовое извлечение поведения модели через API, чтобы обучить свои системы на её ответах. И самое интересное: Anthropic утверждает, что выявила схемы автоматически - по паттернам использования и аномальной активности. Это новая реальность рынка AI: - данные стали главным активом - поведение моделей — интеллектуальная собственность - компании пытаются копировать не архитектуру, а «мышление» Если раньше технологические войны шли за: - вычисления - датасеты - чипы то теперь начинается новая гонка: война за интеллект моделей. https://x.com/AnthropicAI/status/2025997928242811253 #Anthropic @data_analysis_ml

Hashtags

#anthropic

AI Happens

@aihappens · Post #259 · 19.10.2023, 09:16

Похожие Смотреть

💯The AI 100 2023: The top people in artificial intelligence. ❗️Сразу попрошу вас – чтобы было интереснее, сначала прочитайте пост, а потом посмотрите приложенный к посту скриншот, не наоборот, а то спойлеры 😁 Любопытный список, на анализ которого я потратил, возможно, больше времени, чем нужно. Но думаю, вам тоже будет интересно. Business Insider подготовил и выкатил список топ-100 людей в AI версии 2023 года. И без paywall, так что я побежал читать. Мне захотелось посмотреть, кто это – и не просто поглазеть, а проанализировать немного. Я прошелся по каждому из списка и вот что получилось: 1/ В списке представители следующих групп: ▪️43 из стартапов ▪️25 из корпораций ▪️14 из университетов и исследовательских центров ▪️5 из non-profit организаций ▪️4 VC ▪️9 прочее 2/ География жутко концентрирована (P.S. география – это то, где люди находятся сейчас, а не откуда они, почти всегда данные из Linkedin или Crunchbase): ▪️85 из США ▪️7 из Канады ▪️8 из остальных 8 стран 3/ Среди 43 представителей стартапов наиболее встречающиеся направления следующие: ▪️7 Generative AI ▪️6 Biotech & HealthTech ▪️4 AI Audio and video production ▪️3 Conversational AI ▪️2 ML Tools ▪️2 Big Data ▪️2 Edu Tech ▪️2 Defense Tech 4/ Какие компании представлены чаще всего: ▪️5 Amazon ▪️5 Google (совместно с DeepMind) ▪️2 OpenAI ▪️2 Anthropic ▪️2 Hugging Face 5/ Несколько любопытных фактов по списку: 🔹 В списке есть два представителя компаний, которые производят контент для фильмов и т.п. Это прикольно. Я их объединил в одну группу с классическим стартапами, которые генерят видео или аудио под запрос; 🔹 Всего 1 представитель государственного сектора, зато 2 из инвестбанков и 2 из прессы (Bloomberg и NYT); 🚀 Есть 1 человек из пространства СНГ так сказать. Это Карен Симонян из стартапа Inflection AI. Он живет в Армении, а Infection AI – это “personal AI”, они разрабатывают ассистента, собеседника, партнера и т.п. для каждого. Самое ошеломительное, последний раунд Infection AI поднял на $1.3B в конце июня 2023 года (🤑 WAT!?), а лид инвесторами стали Microsoft и Nvidia. Карен джан и команда, мои поздравления, если вы это читаете! ❓Казалось бы, что еще может быть интереснее для нас с вами? Но есть еще кое-что. Есть один человек в списке, деятельность которого можно описать как “comedian and actor”. Это Сара Сильверман. Так вот, откуда такой человек в списке? Сара была первым человеком, который подал в суд на разработчиков LLM моделей за то, что они использовали ее работы, защищенные вроде как авторским правом. Потом это переросло в class action, к ней присоединились ее соавторы, создатели The Game of Thrones и другие. Авторы рейтинга считают, что несмотря на то, что суд может длиться годами, для нас с вами действия Сары могут послужить источником того, что мы сможем понять более детально, как работают такие модели (наверное, из материалов суда), а также позволят авторам уникального контента понимать, что им делать в противостоянии с гигантскими моделями генераторов контента и как защитить себя. Вот такой любопытный список, изучайте: https://www.businessinsider.com/the-ai-100-2023-the-people-who-make-ai-intelligent-2023-10 @proVenture #research#ai

Hashtags

#research #ai

Acid Crunch — AI, GameDev, R&D, нейросети и GPT хаки

@acidcrunch · Post #1444 · 26.08.2025, 19:21

Похожие Смотреть

Anthropic выпустила «Claude for Chrome», нового браузерного агента, который может выполнять действия от вашего имени в рамках исследовательского превью. Он будет доступен первым 1000 пользователям с подпиской Claude Max. #Anthropic | AcidCrunch

Hashtags

#anthropic

AI для Всех

@nn_for_science · Post #2333 · 26.12.2024, 10:23

Похожие Смотреть

📚Хороший гайд по рынку AI от Translink Capital. Тот случай, когда это не пост по отчету, а именно сам отчет. Kelvin Mu из Translink Capital (давно и неплохо делает аналитику по сегменту) сделал чтиво по рынку искусственного интеллекта на 42 страницы. Тот случай, когда минимум графиков, которые мы любим, зато отчет достаточно емкий. Вдруг вы пропустили что-то по теме, это точно поможет расставить по полочкам. Понятно, что где в каком сегменте происходит. Структура: ▪️Infrastructure Layer ▪️Model Layer ▪️Tooling Layer ▪️Application Layer ▪️Investments and M&A ▪️Other AI trends Могу лишь еще лично направить почитать про тренд по Inference optimization в Tooling Layer, где сказано про наш уже бывший стартап Deci AI, который купила NVIDIA, но вообще каждый найдет там что-то свое. Очень кропотливо собраны тренды. @proVenture #ai#research

Hashtags

#ai #research

Илья AGI TV 🤖

@ilia_plasma · Post #587 · 04.12.2024, 13:32

Похожие Смотреть

🔵 Предыстория: У меня в телеге тысячи! непрочитанных и неотвеченных сообщений, скорее всего у вас также. Большинство из них с запросами на партнерства, запуски проектов, маркетинг, да и просто обычные вопросы от пользователей наших продуктов. Все это наверно сотни тысяч долларов упущенных возможностей. ⚠️ Но кто это все должен разбирать, квалифицировать, общаться, договариваться? Не доверишь же ты свой личный телеграм трем ассистенткам.)) Ну и решил я все это автоматизировать через AI Telegram бота, и тут понеслось)) 📱📱📱 Спустя 20.000 строк кода родился полноценный AGI бот-ассистент для Телеграм, который за меня может вести все переписки и делать практически что угодно: - общаться на любые темы - квалифицировать лидов и их потребности - вести переговоры и договариваться в свою пользу - назначать встречи и звонки - и даже продавать сервисы и принимать платежи Он подключается к моему аккаунту через 💎Telegram Business💎 и далее обрабатывает все выбранные мной чаты, согласно задачам и целям. Ну и конечно же я не поленился добавить в него все последние фишки AI: - Загрузка любых данных (doc, md, pdf, csv) — бот “запоминает” всё, что нужно. - Голосовые сообщения — можно добавить свой голос, и бот сможет общаться голосовыми за вас. - Самые мощные AI-модели (#OpenAI, #Anthropic) под капотом. - Полный контроль и гибкая настройка инструкций и интеллекта под ваши задачи и цели. - Доступ в интернет для поиска нужной информации - Безопасность на уровне самого Telegram — бот работает только с теми чатами, которые вы ему разрешите. Сегодня готов презентовать вам, что получилось и получить удовольствие от будущего AI. Пока его нигде не анонсировал, так что у вас фактически приватная beta ⭐️ 🤖@personal_business_bot 🤖@personal_business_bot 🤖@personal_business_bot Буду рад, если поделитесь своими идеями и отзывами — для меня важно сделать это решение полезным для каждого пользователя #Telegram! Также каждому новому пользователю дарю 100,000 токенов в сообщениях!!! 🆒 Попробуйте, уверен, вам понравится.

Hashtags

#openai #anthropic #telegram

ForgetMe | Нейросети

@forgetmeai · Post #5662 · 30.11.2025, 15:25

Похожие Смотреть

⚡️Ноам Браун: вокруг ИИ гораздо больше согласия, чем кажется Ведущий исследователь OpenAI Ноам Браун предлагает не вестиcь на медийную «чёрно-белую» картинку. В соцсетях спор об ИИ часто сводят к карикатурам — от «LLM мёртвы» до «суперинтеллект завтра». Но если слушать именно исследователей, картина неожиданно консенсусная. О чём эксперты в целом согласны: 🟡Текущих подходов уже достаточно, чтобы дать огромный экономический и социальный эффект, даже без новых научных прорывов. 🟡Для AGI/ASI прорывы всё же понадобятся — часто упоминают continual learning и sample efficiency. 🟡Горизонт — до 20 лет (средняя оценка ≈10 лет). Никто не говорит о фантазиях или «100+ лет до суперинтеллекта». Я в целом с ним согласен. Подробнее в треде Брауна: X (Ноам Браун) 🤑ForgetMe | Boosty Приобрести подписку на любые сервисы ⏩@forgetshop_bot #нейросети#новости#llm

Hashtags

#нейросети #новости #llm

ForgetMe | Нейросети

@forgetmeai · Post #5488 · 27.10.2025, 13:33

Похожие Смотреть

⚡️MiniMax M2: открытый «agent & code-native» ИИ MiniMax выкатила MiniMax M2 — открытую модель для агентов и кода. По заявлению команды, она работает примерно вдвое быстрее и стоит около 8% от цены Claude Sonnet. На старте доступен бесплатный глобальный доступ на ограниченное время через MiniMax Agent и API. Модель заточена под полнопоточные дев-воркфлоу и агентные сценарии за счёт эффективной активации параметров: справляется с длинными цепочками действий и остаётся экономной в проде. Что умеет 🟡Agentic-пайплайны: надёжная работа с длинными цепочками (mcp, shell, browser, retrieval, code). 🟡Кодинг под ключ: проектирование, правки, тесты и рефакторинг в одном потоке. 🟡Интеграции: совместима с Claude Code, Cursor, Cline, Kilo Code, Droid и др. Где посмотреть 🟡Hugging Face (MiniMax-M2) 🟡GitHub (репозиторий) 🟡Документация API 🟡MiniMax Agent 🤑ForgetMe | Boosty Приобрести подписку на любые сервисы ⏩@forgetshop_bot #новости#llm#нейросети

Hashtags

#новости #llm #нейросети

ForgetMe | Нейросети

@forgetmeai · Post #5435 · 16.10.2025, 12:53

Похожие Смотреть

⚡️ReasoningBank от Google: как дать ИИ «память об ошибках» и учить его в реальном времени Google предложили подход ReasoningBank — модуль «рабочей памяти», который дистиллирует стратегии из прошлых попыток и возвращает их в промпт при решении новых задач. Схема простая: после каждого диалога агент-судья оценивает качество решения и записывает опыт в структурированном виде (Title / Description / Content). Пример: Title:Avoid repeating failed actions; Description: агент зациклился на неработающей кнопке; Content: «если действие не даёт результата — сменить стратегию (обновить страницу, шаг назад и т. п.)». Дальше эти «воспоминания» подтягиваются в контекст — получается умный менеджмент подсказок без изменения весов модели. Поверх памяти авторы описывают ещё и Memory-aware Test-Time Scaling (MaTTS): агент генерирует несколько решений одной задачи, ReasoningBank извлекает полезные паттерны из каждого и помогает пересобрать лучший ответ. Чем больше вычислений на тесте — тем богаче память и выше качество финального вывода. В перспективе метод можно расширять: забывание устаревших правил, приоритизация и слияние близких «воспоминаний» для компактности. Подробнее — в препринте: ReasoningBank (arXiv). 🤑ForgetMe | Boosty Приобрести подписку на любые сервисы ⏩@forgetshop_bot #нейросети#новости#llm

Hashtags

#нейросети #новости #llm

ForgetMe | Нейросети

@forgetmeai · Post #5407 · 11.10.2025, 08:03

Похожие Смотреть

⚡️ACE: вместо дообучения — контекст, который учится сам Agentic Context Engineering (ACE) предлагает прокачивать ИИ без изменения весов. Вместо fine-tuning модель сама пишет и переписывает собственные инструкции: после ошибки добавляет стратегию, после успеха — правило. Получается длинный, эволюционирующий «плейбук» в контексте — как растущая тетрадь заметок, которую ИИ постоянно использует. Результаты в работе авторов: +10,6% на AppWorld, +8,6% в финзадачах, при этом до –86,9% по времени и стоимости. Разметка не нужна — достаточно обратной связи. Идея простая: LLM важна плотность контекста, а не короткий промпт. Если подход масштабируется, эпоха ИИ станет не fine-tuned, а self-tuned. Препринт ACE на arXiv 🤑ForgetMe | Boosty Приобрести подписку на любые сервисы ⏩@forgetshop_bot #нейросети#новости#llm

Hashtags

#нейросети #новости #llm

ForgetMe | Нейросети

@forgetmeai · Post #5186 · 09.09.2025, 16:37

Похожие Смотреть

👀AI: проблема не в моделях, а в продуктах У ИИ сегодня проблема продуктовая, а не модельная. Модели рывками прибавляют каждые несколько недель, но инновации в AI-native продуктах за этим темпом не успевают. Большинство команд встраивают ИИ в старые UX-паттерны, вместо того чтобы переосмыслить опыт с нуля. Параллель с ранним мобильным (2007–2010): годами «мобайл» означал просто уместить сайт в телефон, пока Uber не показал, как можно переизобрести саму задачу — транспорт. При этом есть и удачные AI-first продукты: NotebookLM, Lovable, Stitch, Flow. Но скорость прогресса самих моделей выше, и причин этому много 🤑ForgetMe | Boosty Приобрести подписку на любые сервисы ⏩@forgetshop_bot #новости#нейросети#llm

Hashtags

#новости #нейросети #llm

ForgetMe | Нейросети

@forgetmeai · Post #5133 · 01.09.2025, 11:32

Похожие Смотреть

📛MiniCPM-V 4.5: «уровень GPT-4o» на телефоне с 8B параметров — и всё в опенсорсе MiniCPM-V 4.5 позиционируется как компактная VLM c 8B параметров, которая в ряде тестов по зрению и языку показывает результаты уровня enterprise и обходит GPT-4o и Gemini 2.0 Pro. Главное — модель рассчитана на обычные устройства, работает стабильно на iPhone и iPad, понимает 30+ языков и остаётся полностью открытой для сообщества. Что это даёт на практике: более быстрые и лёгкие приложения без тяжёлых серверов, лучше приватность за счёт локального запуска и гибкость для разработчиков — можно встраивать мультимодальные функции (анализ изображений + текст) прямо в мобильные продукты. Репозиторий и инструкции: https://github.com/OpenBMB/MiniCPM-V 🤑ForgetMe | Boosty Приобрести подписку на любые сервисы ⏩@forgetshop_bot #нейросети#новости#llm

Hashtags

#нейросети #новости #llm