AML

@MachineLearningResearch

Technologies

ALGORITHMS MACHINE LEARNING

Subscribers136Current channel subscribers

Tracked posts812Indexed post count

Recent reach825Sum of recent post views

Recent posts

Page 26 of 68 · 812 posts

Posted Dec 9

View

Нельзя допустить "потери поколения", которые не захотят думать: Ответственность за принятие решений должна лежать на конкретном человеке Не использовать технологии — значит проиграть все, использовать бездумно — утратить все Бездумное использование может привести к распылению идентичности россиян Нельзя допустить разделения на пользователей и "две десятых" представителей элиты

50 views

Posted Dec 9

View

Anthropic на AI Engineering Code Summit представила доклад "Skills > Agents" (фокус на "Agent Skills" как альтернативе множеству агентов) Они аргументируют, что вместо строительства кучи специализированных Ml-агентов лучше инвестировать в модульные навыки, которые делают общего агента, как Claude универсальным и полезным для реальных задач Кстати, Skills были представлены в октябре ещё Они представили график, объясняющий почему навыки важнее агентов в развитии Ml, особенно в контексте их инструмента Claude Code С накоплением навыков Ml становится не просто умным, а эффективным Навыки умножают интеллект, делая систему гибкой и применимой в реальных сценариях

58 views

Posted Dec 9

View

Как «вырезать» из большой нейросети опасные знания, при этом почти не навредить её обычным способностям Новая технология называется Selective Gradient Masking (SGTM) Статья тут Простыми словами это вот как: 1. Во время дообучения модели говорят модели: «Вот опасные тексты — запоминай их только в этих специальных ячейках памяти (оранжевые) А всё полезное — только в обычных ячейках (синие)» 2. Модель послушно разделяет знания: плохое в одну сторону, хорошее в другую 3. В конце просто берут и обнуляют «оранжевые» ячейки Всё Опасные знания физически исчезли из модели, их нельзя «вытащить» даже если очень постараться Главное — это работает даже, когда часть опасных текстов не нашли и не пометили, а это в реальной жизни почти всегда так Другие проекты по безопасности тут Результаты интересные: - после «вырезания» модель почти не теряет общие знания, - чтобы вернуть удалённые способности обратно, нужно в 7 раз больше усилий, чем раньше, - лишние вычисления при обучении — всего +5–6 %

46 views

Posted Dec 8

View

В журнале "Проблемы прогнозирования" (№6, 2025) опубликована статья эксперта ЦМАКП: "Прогноз предложения труда специалистов по информационно-коммуникационным технологиям высшей квалификации в России" На основе балансовой модели определены границы возможного увеличения количества специалистов по ИКТ до 2030 года исходя из возможностей системы образования и профессиональной мобильности Нижняя граница определена исходя из количества поступивших в ВУЗы на ИТ-специальности и обычного % выпустившихся и трудоустроившихся по специальности Верхняя граница прогноза дополнительно предполагает высокий уровень притока в ИТ специалистов из других сфер

40 views

Posted Dec 8

View

A transformer's attention could be 99 % sparser without losing its smarts A new research from MPI-IS, Oxford, and ETH Zürich shows it can A simple post-training method strips away redundant connections, revealing a cleaner, more interpretable circuit This suggests much of the computation we rely on is just noise

34 views

Posted Dec 8

View

From Code Foundation Models to Agents and Applications: A Comprehensive Survey and Practical Guide to Code Intelligence https://arxiv.org/abs/2511.18538 https://arxiviq.substack.com/p/from-code-foundation-models-to-agents Авторы представили монументальный обзор по Code Intelligence: от фундаментальных LLM до автономных AI-инженеров Это не просто пересказ литературы, а практическое руководство с оригинальными экспериментами Исследователи вывели законы масштабирования специально для языков программирования, сравнили рецепты SFT (Supervised Fine-Tuning) и оценили стратегии обучения с подкреплением, такие как RLVR Работа перекидывает мост между стерильными бенчмарками генерации кода и реальностью разработки на уровне репозиториев Статья доказывает, что код скейлится иначе, чем текст, и дает готовые инструкции для создания инструментов следующего поколения — от умного автокомплита до систем полной поддержки и фикса багов

35 views

Posted Dec 8

View

Cамым дешёвым способом вычислений Ml станут спутники с локальными Ml-вычислителями в низколатентной, солнцесинхронной орбите, где всегда есть солнечный свет для питания Только результаты будут передаваться обратно на Землю, что минимизирует трафик Это станет самым быстрым способом масштабирования, поскольку на Земле уже трудно найти доступные источники электроэнергии Запуск 1 мегатонны спутников в год (каждый с мощностью 100 кВт) добавит 100 ГВт Ml-мощности ежегодно — без затрат на эксплуатацию и обслуживание Cпутники подключатся к constellation Starlink через высокоскоростные лазеры Фабрики спутников на Луне с использованием электромагнитной рельсовой пушки для запуска спутников на орбиту без ракет, позволят масштабировать до >100 ТВт Ml-мощности в год и сделать значительный шаг к цивилизации Кардашёва II

369 views

Posted Dec 8

View

Данные Cloudflare показывают, что Google получает огромное преимущество перед OpenAI и Anthropic в сборе данных для Ml Компания использует сочетание поискового робота и сканирования для обучения искусственного интеллекта Гендиректор Cloudflare Мэтью Принс заявил, что Google получает выгоду от привилегированного доступа к интернету Причина в том, как поисковый робот связан с системами сбора данных для Ml

35 views

Posted Dec 7

View

35 views

Posted Dec 7

View

Путь к безопасному superintelligence — концепция co-improvement: Ml развивается вместе с людьми, решая проблему выравнивания совместно a16z и OpenRouter выпустили свежий отчёт по реальному использованию LLM в 2025 году Anthropic запустила Interviewer для масштабного проведения интервью Shopify выпустил Tangle — первая open source платформа для экспериментов с content-based кэшированием и визуальным редактором Стартап Harmonic доказал проблему Эрдёша №124, а математики оценили это AIRI представили Wikontic — построение графов знаний в 10–20 раз дешевле OpenAI в аварийном режиме готовит новую модель, которая выйдет как экстренный ответ на Gemini 3 DeepSeek запустили две модели для агентов Google представили open-source фреймворк для оценки универсального понимания звука в мультимодальном Ml Mistral выпустили семейство моделей Mistral 3 Berkeley и UIUC научили BERT общаться через диффузию SemiAnalysis выяснили,что OpenAI за 1,5 года не создали новых фронтирных моделей Google DeepMind перешла на новый подход к пониманию работы Ml-систем OpenAI нашламетод, который обучает Ml сообщать, когда он нарушает инструкции или идёт в обход Выпущена статья SIMA 2 от Google DeepMind — воплощённый Ml-агент для виртуальных миров с новой архитектурой адаптации LLM LatentMAS позволяет агентам общаться без каналов Anthropic протестировала агентов на блокчейн-смарт-контрактах LabOS - 1-й Co-Scientist с Ml и XR — система использует мультимодальное восприятие и самообучающихся агентов для помощи в реальном времени

44 views

Posted Dec 6

View

Представили Embedded Universal Predictive Intelligence (MUPI) — математический фреймворк, переопределяющий агентов не как внешних наблюдателей, а как сущности, встроенные *в* совместную вселенную Вместо моделирования среды вводится байесовская смесь по «вселенным» (программам, определяющим совместную динамику агента и среды) Это решает проблему бесконечной рекурсии во взаимных предсказаниях Введен Reflective Universal Inductor (RUI) — теоретический оракул, гарантирующий, что класс гипотез агента включает его самого Также определены новые теоретико-игровые концепции, такие как Субъективное Встроенное Равновесие (Subjective Embedded Equilibrium), объясняющие сотрудничество в ситуациях типа дилеммы заключенного, где классические равновесия Нэша не работают Работа подводит теоретическую базу под поведение современных фундаментальных моделей (Foundation Models), которые естественным образом предсказывают последовательности действий и наблюдений Фреймворк решает давнюю проблему «зерна истины» (Grain of Truth) в мультиагентном RL (MARL), где агент не может идеально моделировать среду с собственной копией без бесконечной рекурсии Доказано, что универсальные прайоры (бритва Оккама) естественным образом ведут к осознанию структурного сходства Это дает нормативное обоснование Эвиденциальной теории принятия решений: агенты, моделирующие себя как часть мира, будут сотрудничать со структурно похожими коллегами без явной коммуникации Embedded Universal Predictive Intelligence: a coherent framework for multi-agent learning https://arxiv.org/abs/2511.22226 https://arxiviq.substack.com/p/embedded-universal-predictive-intelligence

43 views

Posted Dec 6

View

Разбор того, как создают и обучают модели, ориентированные на написание кода, и как на их основе строят полноценные софт-агенты Что в нём разбирается: Как формируют модель - Сбор и очистка гигантских датасетов кода - Предобучение: модель впитывает реальные паттерны программирования в промышленных масштабах - SFT и RL: дополнительные этапы, где модель учат лучше следовать инструкциям, проходить тесты и избегать очевидных ошибок Как модели превращают в инженерных агентов - Агент читает баг-репорт или фичу - Планирует шаги - Меняет файлы - Запускает тесты - Повторяет цикл, пока не добьётся результата Какие проблемы всё ещё остаются - Работа с огромными репозиториями - Безопасность и надёжность генерируемого кода - Корректная оценка качества работы агентов - Реальные приёмы и лайфхаки, которые используют текущие команды Исследование - мощный срез состояния индустрии: от датасетов и архитектур до практических инженерных пайплайнов Это именно то, как современные LLM превращаются в «второго разработчика» в команде https://arxiv.org/abs/2511.18538

36 views

1 2•••5•••10•••15•••20•••24 252627 28•••30•••35•••40•••45•••50•••55•••60•••65•••67 68

← PreviousPage 26 of 68Next →