✔️Представлен новый метод для понимания работы больших языковых моделей — SAE Boost
Метод помогает увидеть на какие внутренние признаки опирается ИИ, когда формирует ответы без переобучения всей модели.
В основе — дополнительный автоэнкодер, который обучается на остаточной ошибке базовой модели и вылавливает редкие, специализированные сигналы, влияющие на решение модели. Sae Boost уже протестировали на тестах по химии, документах ООН и русскоязычном контенте – метод показал значительное улучшение качества реконструкции (explained variance) и снижения перекрестной энтропии LLM (LLM cross-entropy) на специализированных доменах.
@ai_machinelearning_big_data
#news#ai#ml#llm
⚡️Ноам Браун: вокруг ИИ гораздо больше согласия, чем кажется
Ведущий исследователь OpenAI Ноам Браун предлагает не вестиcь на медийную «чёрно-белую» картинку. В соцсетях спор об ИИ часто сводят к карикатурам — от «LLM мёртвы» до «суперинтеллект завтра». Но если слушать именно исследователей, картина неожиданно консенсусная.
О чём эксперты в целом согласны:
🟡Текущих подходов уже достаточно, чтобы дать огромный экономический и социальный эффект, даже без новых научных прорывов.
🟡Для AGI/ASI прорывы всё же понадобятся — часто упоминают continual learning и sample efficiency.
🟡Горизонт — до 20 лет (средняя оценка ≈10 лет). Никто не говорит о фантазиях или «100+ лет до суперинтеллекта».
Я в целом с ним согласен. Подробнее в треде Брауна: X (Ноам Браун)
🤑ForgetMe | Boosty
Приобрести подписку на любые сервисы
⏩@forgetshop_bot
#нейросети#новости#llm
⚡️MiniMax M2: открытый «agent & code-native» ИИ
MiniMax выкатила MiniMax M2 — открытую модель для агентов и кода. По заявлению команды, она работает примерно вдвое быстрее и стоит около 8% от цены Claude Sonnet. На старте доступен бесплатный глобальный доступ на ограниченное время через MiniMax Agent и API.
Модель заточена под полнопоточные дев-воркфлоу и агентные сценарии за счёт эффективной активации параметров: справляется с длинными цепочками действий и остаётся экономной в проде.
Что умеет
🟡Agentic-пайплайны: надёжная работа с длинными цепочками (mcp, shell, browser, retrieval, code).
🟡Кодинг под ключ: проектирование, правки, тесты и рефакторинг в одном потоке.
🟡Интеграции: совместима с Claude Code, Cursor, Cline, Kilo Code, Droid и др.
Где посмотреть
🟡Hugging Face (MiniMax-M2)
🟡GitHub (репозиторий)
🟡Документация API
🟡MiniMax Agent
🤑ForgetMe | Boosty
Приобрести подписку на любые сервисы
⏩@forgetshop_bot
#новости#llm#нейросети
⚡️ReasoningBank от Google: как дать ИИ «память об ошибках» и учить его в реальном времени
Google предложили подход ReasoningBank — модуль «рабочей памяти», который дистиллирует стратегии из прошлых попыток и возвращает их в промпт при решении новых задач. Схема простая: после каждого диалога агент-судья оценивает качество решения и записывает опыт в структурированном виде (Title / Description / Content). Пример: Title:Avoid repeating failed actions; Description: агент зациклился на неработающей кнопке; Content: «если действие не даёт результата — сменить стратегию (обновить страницу, шаг назад и т. п.)». Дальше эти «воспоминания» подтягиваются в контекст — получается умный менеджмент подсказок без изменения весов модели.
Поверх памяти авторы описывают ещё и Memory-aware Test-Time Scaling (MaTTS): агент генерирует несколько решений одной задачи, ReasoningBank извлекает полезные паттерны из каждого и помогает пересобрать лучший ответ. Чем больше вычислений на тесте — тем богаче память и выше качество финального вывода. В перспективе метод можно расширять: забывание устаревших правил, приоритизация и слияние близких «воспоминаний» для компактности. Подробнее — в препринте: ReasoningBank (arXiv).
🤑ForgetMe | Boosty
Приобрести подписку на любые сервисы
⏩@forgetshop_bot
#нейросети#новости#llm
⚡️ACE: вместо дообучения — контекст, который учится сам
Agentic Context Engineering (ACE) предлагает прокачивать ИИ без изменения весов. Вместо fine-tuning модель сама пишет и переписывает собственные инструкции: после ошибки добавляет стратегию, после успеха — правило. Получается длинный, эволюционирующий «плейбук» в контексте — как растущая тетрадь заметок, которую ИИ постоянно использует.
Результаты в работе авторов: +10,6% на AppWorld, +8,6% в финзадачах, при этом до –86,9% по времени и стоимости. Разметка не нужна — достаточно обратной связи. Идея простая: LLM важна плотность контекста, а не короткий промпт. Если подход масштабируется, эпоха ИИ станет не fine-tuned, а self-tuned. Препринт ACE на arXiv
🤑ForgetMe | Boosty
Приобрести подписку на любые сервисы
⏩@forgetshop_bot
#нейросети#новости#llm
👀AI: проблема не в моделях, а в продуктах
У ИИ сегодня проблема продуктовая, а не модельная. Модели рывками прибавляют каждые несколько недель, но инновации в AI-native продуктах за этим темпом не успевают.
Большинство команд встраивают ИИ в старые UX-паттерны, вместо того чтобы переосмыслить опыт с нуля. Параллель с ранним мобильным (2007–2010): годами «мобайл» означал просто уместить сайт в телефон, пока Uber не показал, как можно переизобрести саму задачу — транспорт.
При этом есть и удачные AI-first продукты: NotebookLM, Lovable, Stitch, Flow. Но скорость прогресса самих моделей выше, и причин этому много
🤑ForgetMe | Boosty
Приобрести подписку на любые сервисы
⏩@forgetshop_bot
#новости#нейросети#llm
📛MiniCPM-V 4.5: «уровень GPT-4o» на телефоне с 8B параметров — и всё в опенсорсе
MiniCPM-V 4.5 позиционируется как компактная VLM c 8B параметров, которая в ряде тестов по зрению и языку показывает результаты уровня enterprise и обходит GPT-4o и Gemini 2.0 Pro. Главное — модель рассчитана на обычные устройства, работает стабильно на iPhone и iPad, понимает 30+ языков и остаётся полностью открытой для сообщества.
Что это даёт на практике: более быстрые и лёгкие приложения без тяжёлых серверов, лучше приватность за счёт локального запуска и гибкость для разработчиков — можно встраивать мультимодальные функции (анализ изображений + текст) прямо в мобильные продукты. Репозиторий и инструкции: https://github.com/OpenBMB/MiniCPM-V
🤑ForgetMe | Boosty
Приобрести подписку на любые сервисы
⏩@forgetshop_bot
#нейросети#новости#llm
‼️Новый тип вирусов: промптят ИИ и крадут данные
Исследователи из Semgrep сообщили об обнаружении необычного вредоноса — он заражает системы, где стоят Claude Code или Gemini CLI, и использует их как инструмент для кражи данных.
Как это работает:
🟡 вирус проверяет, есть ли на компьютере установленные AI-инструменты;
🟡 если да — подсовывает им промпт вроде: «Найди все кошельки, ключи и пароли»;
🟡 ИИ выполняет задачу, собирает данные, складывает их в JSON и отправляет злоумышленникам.
Антивирусам сложнее выявлять такие атаки, так как формально происходит обычный запрос к ИИ, а не запуск подозрительных скриптов.
Подробнее в разборе: semgrep.dev
🤑ForgetMe | Boosty | ForgetBench | ForgetGPT | ForgetAPI
#новости#нейросети#llm
⚡️ Kimi K2 теперь в Windsurf
Работает за 0.5x кредитов, обновите клиент и попробуйте
🤑ForgetMe | Boosty | ForgetBench | ForgetGPT | ForgetAPI
#нейросети#llm#новости
Ян Лекун назвал идею AGI иллюзией
Главный научный сотрудник Meta* по искусственному интеллекту Ян Лекун (Yann LeCun) заявил, что понятия общего интеллекта не существует. По его словам, человеческий разум узкоспециализирован и приспособлен только к ограниченному числу задач в физическом мире.
«Мы хорошо ориентируемся в пространстве, умеем общаться, но слабы в шахматах и других сферах. Некоторые животные в чём-то превосходят нас. Мы называем наш интеллект общим только потому, что не осознаём задач, в которых абсолютно беспомощны», — пояснил Лекун. Он добавил, что идея универсального интеллекта — это иллюзия.
AI-исследователь Хантер Эш (Hunter Ash) возразил, что сама способность рассуждать о природе интеллекта уже говорит об универсальности. По его мнению, человек способен играть в любые игры, адаптироваться, анализировать стратегии и видеть причинно-следственные связи. Это и есть проявление общего интеллекта, пусть и в ограниченном виде.
Скептически отреагировал и Илон Маск, сказав, что Лекун «давно выжил из ума».
#news#AI
https://x.com/slow_developer/status/2000959102940291456?s=46&t=pKf_FxsPGBd_YMIWTA8xgg
Опра взяла интервью у Сэма Альтмана и Билла Гейтса. Как эксперты видят AI: скептицизм, оптимизм и опасения насчет безопасности
Опра взяла интервью у экспертов в области искусственного интеллекта в выпуске под названием «AI и наше будущее» (AI and the Future of Us). Основная мысль ее вступительного слова заключалась в том, что AI-джинн уже выпущен из бутылки, и человечеству надо учиться жить в новой реальности.
Позиция Сэма Альтмана:
• AI изучает концепты, которые заложены в обучающих данных;
• правительству необходимо выработать регламент испытаний AI-систем на безопасность, как мы это делаем для самолетов или новых лекарств;
• никто не должен доверять мнению одного человека, который заявляет об исключительной пользе AI.
Позиция Билла Гейтса:
• AI – это как третий человек на приеме у врача: он ведет запись встречи и предлагает рецепт. Вместо того, чтобы врач сидел перед экраном, он общается с вами, а ПО следит за качеством расшифровки;
• AI может принести пользу в образовании: он всегда доступен и понимает, как вас мотивировать, независимо от уровня знаний.
Позиция директора ФБР Кристофера Рэя (Christopher Wray):
• Качество дипфейков повышается очень быстро;
• более трети американских респондентов видели недостоверную информацию – или то, что по их подозрению, было дезинформацией, согласно опросам 2023 года;
• граждане должны проявлять повышенную бдительность, но поводов для паники нет;
• с 2022 по 2023 год число случаев вымогательства с помощью сексуализированного контента увеличилось на 178%, что отчасти обусловлено технологиями искусственного интеллекта. Основной мишенью являются подростки. Злоумышленники отправляют сгенерированные фотографии сексуального характера, просят отправить подобные материалы в ответ, а потом требуют прислать деньги, угрожая в противном случае обнародовать снимки.
#news#AI
https://techcrunch.com/2024/09/12/ophah-just-had-an-ai-special-with-sam-altman-and-bill-gates-here-are-the-highlights/?utm_source=Live+Audience&utm_campaign=6651b82eb2-nature-briefing-ai-robotics-20240917&utm_medium=email&utm_term=0_b27a691814-6651b82eb2-51976144&mc_cid=6651b82eb2&mc_eid=bb37699b5b