TGINSIGHT CHAT
Machinelearning
@ai_machinelearning_big_data
ТехнологииПогружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri
Последние посты
Тег: #deepmind · 8 постов
🌟Как YouTube ускорил проверку валидных рекомендаций в LLM в 948 раз. YouTube и Google DeepMind опубликовали статью и код фреймворка STATIC. Проблема, которую он решает, хорошо знакома всем, кто строит рекомендательные системы на базе LLM: модель генерирует идентификаторы позиций, которых нет в каталоге, вышли из продажи или нарушают бизнес-правила. Именно поэтому YouTube выдает старые видео в ленте там, где должны появляться ролики последней недели. Очевидное решение - префиксное дерево: на каждом шаге декодирования маска блокирует невалидные токены. Работает в целом нормально, но убивает производительность на TPU и GPU. Причины две: 🟠Обход через цепочки указателей создает случайный, несмежный паттерн доступа к памяти, а память ускорителей рассчитана на потоковое чтение блоками, а не на такой режим. 🟠Гугловский XLA-компилятор требует статических вычислительных графов, а префиксное дерево с управлением потоком, зависящим от данных, в это не вписывается. В итоге префиксное дерево на CPU удваивает время инференса, что для системы с целевой задержкой ≤10 мс на шаг неприемлемо. STATIC меняет подход принципиально: дерево разворачивается в статическую разреженную матрицу формата Compressed Sparse Row. Обход превращается в векторизованную операцию, которую акселератор умеет выполнять нативно. Для первых двух уровней дерева, где коэффициент ветвления максимален, используется предвычисленная плотная булева маска: проверка валидности токена сводится к прямому обращению по индексу, без какого-либо перебора. Для глубоких уровней работает специализированное ядро Vectorized Node Transition Kernel, оно читает фиксированный блок данных вне зависимости от реального числа дочерних узлов, не создавая условных переходов. В этом и есть вся соль: весь граф остается статическим, XLA не перекомпилирует ничего на ходу. 🟡Тесты и результаты Замеры проводили на TPU v6e с 3B-моделью и словарем из 20 млн. свежих видео. STATIC добился задержки 0,033 мс на шаг декодирования (это всего 0,25% от общего времени инференса. Для сравнения: префиксное дерево на CPU давало +31,3 мс (239% от инференса), лучший из конкурирующих методов непосредственно на акселераторе, PPV Approximate +1,56 мс (11,9%). Итоговый профит: 🟢948x против дерева на CPU; 🟢47x против PPV Approximate; 🟢1033x против точного PPV. По памяти: ~90 МБ на 1 млн. элементов. Для словаря в 20 млн. верхний предел по HBM примерно 1,5 ГБ, на практике - около 75% от этого значения. 🟡STATIC развернут на YouTube в продакшне. A/B-тест с условием «только видео за последние 7 дней» показал +5,1% просмотров свежего контента, +2,9% для трехдневного окна, +0,15% по CTR и 100% соответствие бизнес-правилам. Дополнительный бонус: метод решает проблему рекомендации новых товаров, не представленных в обучающей выборке. На датасете Amazon Reviews Recall@1 вырос с 0% до 1,2–4,4% в зависимости от категории. В репозитории лежит ноутбук, на котором без утомительной настройки можно сразу посмотреть, как строится индекс из Semantic ID и как запускается декодирование с ограничениями. 📌Лицензирование: Apache 2.0 License. 🟡Arxiv 🖥GitHub @ai_machinelearning_big_data #AI#ML#LLM#STATIC#DeepMind
🌏 AlphaEarth Foundations: DeepMind показала ИИ, который создаёт детальную карту Земли DeepMind представила AlphaEarth Foundations - модель, которая объединяет огромные объёмы спутниковых и климатических данных и превращает их в точную карту планеты с детализацией до 10 метров. Что важно: - Модель создаёт компактное 64-мерное представление для каждого участка Земли. Это позволяет быстро анализировать территорию, видеть, как она менялась с 2017 по 2024 год, и сравнивать регионы между собой. - Система делает данные в 16 раз компактнее и примерно на четверть точнее, чем предыдущие подходы. - Можно отслеживать вырубку лесов, рост городов, состояние почв, влияние климата, изменения береговой линии и другие процессы. - AlphaEarth уже встроена в Google Earth Engine, поэтому доступна исследователям, экологам и госорганизациям. Проще говоря, это инструмент, который помогает увидеть Землю в динамике и с высокой точностью, чтобы лучше понимать происходящие изменения. deepmind.google/blog/alphaearth-foundations-helps-map-our-planet-in-unprecedented-detail/ @ai_machinelearning_big_data #DeepMind
Hashtags
🎥 Two Minute Papers выпустили 22-минутное интервью с Джоном Джампером, нобелевским лауреатом и лидом команды DeepMind, создавшей AlphaFold В беседе Джон Джампер рассказывает, как появилось AlphaFold. Он объясняет, что проект начинался как почти недостижимый идеал: попытка научиться предсказывать структуру белков с точностью, которая раньше казалась невозможной. Ключевые моменты видео: Что такое AlphaFold: Система глубокого обучения, которая предсказывает точную трехмерную структуру белка (его рабочую форму) на основе его аминокислотной последовательности. Революция Скорости: AlphaFold выполняет задачу, которая ранее занимала год и стоила $100 000, всего за 5–10 минут с точностью, близкой к экспериментальной. Масштаб Влияния: Предсказаны структуры 200 миллионов белков (все известные науке), что сделало AlphaFold фундаментальным инструментом для миллионов ученых в области разработки лекарств и биологии. Удивительные Открытия: Джампер делится воспоминаниями о том, как команда сомневалась в успехе из-за "слишком легкого" роста производительности, и как модель научилась неявно предсказывать белковые комплексы и даже области, не имеющие фиксированной структуры ("беспорядок"). Будущее: AlphaFold является первым ИИ, который достиг "сверхчеловеческого" уровня в науке, и, по прогнозам, повлияет на почти каждое достижение в современной медицине в ближайшие 20 лет. ✔️ Смотреть интервью: https://www.youtube.com/watch?v=Vhcwjzeukts @ai_machinelearning_big_data #DeepMind#google#AlphaFold
Hashtags
🧠 Google/DeepMind представили AlphaEvolve: ИИ, который помогает математикам и компьютерным теоретикам искать новые результаты. 💡 Как он работает Обычно LLM стараются писать доказательства целиком, но это слишком сложно и ненадёжно. AlphaEvolve идёт другим путём: он не пишет доказательства сам, а генерирует новые маленькие элементы *конструкции (gadgets)*. Эти кусочки можно быстро проверить автоматикой, и если они работают, их можно собрать в более крупные теоремы. 📈 Что удалось найти - Новый результат для задачи MAX-4-CUT (Это задача из теории алгоритмов и комбинаторной оптимизации, разновидность классической задачи MAX-CUT), с конструкцией, которую раньше никто не придумывал. - Сильные новые нижние границы для задач на случайных графах, включая работу с Ramanujan graphs. - Проверка теорем стала в 10 000 раз быстрее, чем в обычных методах. 🧩 Зачем это нужно - Математика требует 100% точности - и тут AI помогает именно как генератор идей, а проверка остаётся строгой и надёжной. - Такой подход экономит годы человеческой работы и открывает дорогу к новым теоремам и алгоритмам. 📄 Подробнее: research.google/blog/ai-as-a-research-partner-advancing-theoretical-computer-science-with-alphaevolve/ @ai_machinelearning_big_data #AI#Math#DeepMind#Research
🤖 Demis Hassabis (Google DeepMind) о будущем робототехники ⦿ Гуманойдные формы могут оказаться ключевыми для повседневного и персонального использования — там, где среда создана под людей. А вот специализированные роботы будут незаменимы на производстве и в лабораториях. ⦿ В ближайшие пару лет нас ждёт «вау-момент» в робототехнике. Но фундаментальные модели пока требуют доработки: надёжности и более глубокого понимания реального мира. ⦿ DeepMind работает сразу в двух направлениях: - как с Android для роботов — универсальный слой ОС, совместимый с любым роботом; - и с вертикальной интеграцией - разработка конкретных роботов «под ключ». Идея проста: скоро роботы будут не только на заводах, но и рядом с нами — а управлять ими станет так же привычно, как смартфоном. 🟢Полное интервью: https://www.youtube.com/watch?v=Kr3Sh2PKA8Y @ai_machinelearning_big_data #DeepMind#Google#DemisHassabis#Robotics
🚨 Очень интересная идея в новой работе Google DeepMind - как справиться с ростом ИИ-агентов, которые начинают действовать как самостоятельные игроки в экономике. Если оставить процесс без контроля, такие агенты могут создать собственную экономику, напрямую связанную с человеческой. Это сулит и выгоды, и риски. Авторы предлагают концепцию «песочницы» (sandbox economy) - контролируемого пространства, где агенты могут торговать и координироваться, не нанося вреда рынкам. Вместо выполнения одной задачи, такие агенты могут: ▪ торговать, вести переговоры и заключать сделки без участия человека, ▪ переключаться между индустриями, формировать временные альянсы, ▪ координировать ресурсы в реальном времени. Первые стандарты вроде Agent2Agent и Model Context Protocol уже соединяют агентов между собой, закладывая основу глобальной экономики «машина-машина». Персональные AI-ассистенты вскоре смогут конкурировать и сотрудничать на этих рынках: торговаться за вычислительные мощности, доступ к данным или бронирование поездок - всё в интересах пользователей. Расчёты будут обеспечиваться цифровыми валютами и системами кредитов. 🟢Экономисты предупреждают: такие рынки будут развиваться быстрее человеческой реакции. Цены, сделки и бизнес-модели могут меняться не за месяцы, а за минуты. 🟢Предложения авторов - Использовать рынки и аукционы для честного распределения ресурсов. ▪Вводить миссионные цели — коллективные задачи, согласованные обществом. ▪Создавать систему удостоверений и репутации для агентов. ▪Применять смарт-контракты, аудит и прозрачные вычисления для доверия и контроля над ии. ▪Разрабатывать гибридное регулирование - сочетание технических протоколов и институциональных мер. Если внедрение будет продумано, триллионы машинных часов можно будет направить на решение глобальных задач - от лечения болезней до строительства инфраструктуры. ⚡️Статья: https://arxiv.org/pdf/2509.10147 @ai_machinelearning_big_data #AI#AgentEconomy#DeepMind#AutonomousAgents
🎧 Perch 2.0 — AI, который слушает природу и спасает вымирающие виды. DeepMind выпустили Perch 2.0 — компактную supervised-модель для биоакустики. Без миллиардов параметров, без сложного self-supervised обучения — просто аккуратная модель, которая побила все бенчмарки и уже работает в полевых исследованиях. 🌱 Почему это важно Звуки природы — это источник данных о биоразнообразии. По аудиозаписям можно понять: - какие животные живут в лесу, - сколько их, - размножаются ли они, - не вытесняются ли они человеком. Но расшифровка аудио — адский труд: в одном часе записи из тропиков десятки накладывающихся голосов. 🐦Что умеет Perch 2.0 Perch 2.0 — универсальный эмбеддер для звуков животных. Берёт 5 секунд аудио → выдаёт вектор, с которым можно: - находить похожие записи, - кластеризовать звуки, - обучать простой классификатор для новых видов (few-shot). ⚡ Работает без GPU и без дообучения. 🛠 Архитектура - Основa: EfficientNet-B3 (12M параметров). - Три головы: 1. Классификация ~15k видов. 2. Прототипная — создаёт семантические логиты для distillation. 3. Source prediction — угадывает источник записи. - Обучение в два шага: 1. Прототипная голова учится сама. 2. Её логиты становятся soft-label’ами для основной (**self-distillation**). 📊 Результаты - SOTA на BirdSet и BEANS (ROC-AUC, mAP). - Отличная переносимость на морских данных (киты, дельфины), которых почти не было в тренировке. - Всё это — без fine-tuning, только фиксированные эмбеддинги. Главный вывод Perch 2.0 показывает, что: 🟢 качественная разметка, 🟢 простая архитектура, 🟢 чёткая постановка задачи могут быть важнее, чем «бесконечные параметры» и сложные LLM. 🌍 Что это меняет - Биологам — быстрый анализ джунглей Бразилии или рифов без написания своих моделей. - ML-инженерам — наглядный пример, как обучать компактные сети без потери качества. - Исследователям — напоминание: не всегда нужен GPT-4, чтобы сделать полезный инструмент. 🟠Github: https://github.com/google-research/perch-hoplite 🟠Подробнее: https://deepmind.google/discover/blog/how-ai-is-helping-advance-the-science-of-bioacoustics-to-save-endangered-species/ 🟠Статья: http://arxiv.org/abs/2508.04665 @ai_machinelearning_big_data #DeepMind#AI#Bioacoustics#MachineLearning#Perch#Ecology
🔥 Google DeepMind представили новую open-source библиотеку на Python для сборки асинхронных AI‑пайплайнов в реальном времени! Новая библиотека позволяет собирать AI-процессы из компонентов — как LEGO для ИИ-агентов. 🔧 Особенности: - Построение асинхронных, компонуемых пайплайнов - Поддержка Gemini и Gemini Live API - Основана на asyncio - Обрабатывает мультимодальные данные: текст, изображения, аудио - Внутри готовые агенты: real-time агент, исследователь, live-комментатор 💡 Подходит для: - Разработки ИИ-агентов - Генеративных моделей, работающих в реальном времени - Быстрой сборки MVP с мультимодальными возможностями Установка: pip install genai-processors Открытый код, готовые компоненты и интеграция с API. • Repo: https://github.com/google-gemini/genai-processors • Blog: https://developers.googleblog.com/en/genai-processors/ @ai_machinelearning_big_data #DeepMind#ai#ml