🎧 Perch 2.0 — AI, который слушает природу и спасает вымирающие виды.
DeepMind выпустили Perch 2.0 — компактную supervised-модель для биоакустики.
Без миллиардов параметров, без сложного self-supervised обучения — просто аккуратная модель, которая побила все бенчмарки и уже работает в полевых исследованиях.
🌱 Почему это важно
Звуки природы — это источник данных о биоразнообразии.
По аудиозаписям можно понять:
- какие животные живут в лесу,
- сколько их,
- размножаются ли они,
- не вытесняются ли они человеком.
Но расшифровка аудио — адский труд: в одном часе записи из тропиков десятки накладывающихся голосов.
🐦Что умеет Perch 2.0
Perch 2.0 — универсальный эмбеддер для звуков животных.
Берёт 5 секунд аудио → выдаёт вектор, с которым можно:
- находить похожие записи,
- кластеризовать звуки,
- обучать простой классификатор для новых видов (few-shot).
⚡ Работает без GPU и без дообучения.
🛠 Архитектура
- Основa: EfficientNet-B3 (12M параметров).
- Три головы:
1. Классификация ~15k видов.
2. Прототипная — создаёт семантические логиты для distillation.
3. Source prediction — угадывает источник записи.
- Обучение в два шага:
1. Прототипная голова учится сама.
2. Её логиты становятся soft-label’ами для основной (**self-distillation**).
📊 Результаты
- SOTA на BirdSet и BEANS (ROC-AUC, mAP).
- Отличная переносимость на морских данных (киты, дельфины), которых почти не было в тренировке.
- Всё это — без fine-tuning, только фиксированные эмбеддинги.
Главный вывод
Perch 2.0 показывает, что:
🟢 качественная разметка,
🟢 простая архитектура,
🟢 чёткая постановка задачи
могут быть важнее, чем «бесконечные параметры» и сложные LLM.
🌍 Что это меняет
- Биологам — быстрый анализ джунглей Бразилии или рифов без написания своих моделей.
- ML-инженерам — наглядный пример, как обучать компактные сети без потери качества.
- Исследователям — напоминание: не всегда нужен GPT-4, чтобы сделать полезный инструмент.
🟠Github: https://github.com/google-research/perch-hoplite
🟠Подробнее: https://deepmind.google/discover/blog/how-ai-is-helping-advance-the-science-of-bioacoustics-to-save-endangered-species/
🟠Статья: http://arxiv.org/abs/2508.04665
@ai_machinelearning_big_data
#DeepMind#AI#Bioacoustics#MachineLearning#Perch#Ecology
Мусорная экосистема в Тихом Океане
Вау. Согласно исследованиям опубликованым в журнале BLOS Biology Большое Тихоокеанское Мусорное Пятно (Great Pacific garbage patch) является процветающим домом для целого ряда организмов.
Размер Тихоокеанского мусорного пятна, сформированного океанскими течениями, около 1.6 миллионов квадратных километров 😱. Водоворот системы собирает мусор со всей северной части Тихого океана. Отходы подхватываются поверхностными течениями и постепенно перемещаются к центру водоворота, который не выпускает мусор за свои пределы. Пластиковые отходы в этом регионе хорошо задокументированы, но мало что известно о плавающих океанских существах, таких как медузы или ракообразные, например.
Так вот в статье с названием "High concentrations of floating neustonic life in the plastic-rich North Pacific Garbage Patch" описывается как авторы плавали 80 дней по этому мусорному континенту и собрали образцы воды, организмов и пластика. Они обнаружили, что плотность плавающей жизни была выше в центральной части мусорного пятна, чем на ее периферии. Еще есть положительная связь между численностью организмов и количеством плавающего пластика. То есть вероятно образовалась антропогенная мусорная экосистема 🌊🍥🐠.
#ecology#climate
ИИ не умеет шутить — к такому выводу пришли эксперты Google DeepMind после исследования, в рамках которого 20 комикам предложили написать стендап-материал с применением чат-ботов вроде ChatGPT и Bard.
Проблемы, с которым столкнулся ИИ:
◽️ ему не хватает человечности, которая делала бы материал забавным;
◽️ он не понимает культурный контекст;
◽️ он не понимает, что такое сарказм, черный юмор или ирония;
◽️ из-за настроек модерации ИИ подвержен определенному уровню цензуры.
#DeepMind
Иногда появляется ощущение, что жизнь вокруг ИИ происходит в режиме быстрой перемотки. Меньше месяца назад Мета выпустила SAM для сегментации любых объектов на изображении, но такое ощущение, что это было всегда. Только за последние 2 дня я уже прочитал около десятка документов, описывающих прототипы использования SAM для изучения недр.
Например, на первых двух картинках (из этого поста) - берем шлиф(срез породы) -> пропускаем через SAM -> выделяем все зерна пород -> автоматически получаем распределение размера зерен (гранулометрия).
На последней картинке я просто кликнул мышкой и выделил все пыльцевые зерна на изображении полученном с помощью электронного микроскопа. Автоматически выделенные зерна можно классифицировать и использовать палеотнологами для определения геологического возраста породы.
#machinelearning#Geo
🤖DeepMindразработала ИИ-чат-бота Sparrow, обученного на большой языковой модели Chinchilla.
Система предназначена для общения с людьми и ответов на вопросы, используя поиск Google. На основе отзывов от пользователей, Sparrow учится генерировать более полезные диалоги, заявили разработчики.
📝 Чтобы предотвратить опасные или оскорбительные сообщения, инженеры собрали экспериментальную группу и попросили участников выбрать несколько ответов модели на один и тот же вопрос. На основе полученных данных исследователи сформировали 23 правила, которых придерживались при доработке чат-бота.
В итоге Sparrow не дает финансовых советов, ведет себя дружелюбно и не притворяется личностью.
👾 Однако модель все еще допускает ошибки, отметили в DeepMind. Время от времени Sparrow уходит от темы или выдумывает случайные ответы. Некоторые участники также смогли обойти ограничения чат-бота.
#DeepMind#NLP
♟YouTubeприменил освоивший настольные игры ИИ-алгоритм MuZero от DeepMind для улучшения сжатия видео.
В компании заявили, что модель снизила битрейт в среднем на 4% без заметной потери качества роликов. По словам исследователя DeepMind Антона Жернова, это значительная экономия вычислительной мощности и пропускной способности. ИИ может помочь жителям стран с ограниченным интернетом смотреть ранее недоступные для них видео, добавил эксперт.
💬 Жернов уточнил, что MuZero работает только с тем YouTube-контентом, где используется метод сжатия видео с открытым исходным кодом VP9, для улучшения которого алгоритм и адаптировался.
#YouTube#DeepMind
🔎 Исследователи из DeepMind совместно с физиками-теоретиками из Испании и Германии разработали нейросеть DM21, которая просчитывает поведение молекул на квантовом уровне. Она доступна на GitHub.
Алгоритм обучили на данных о квантовых структурах множества разных молекул. Он способен оценивать примерную плотность электронов и вычислять силу взаимодействия между ними.
ИИ натренировали распознавать характерные особенности в структуре молекул, чтобы минимизировать погрешность в определении плотности и других свойств ее электронов.
☝️ По словам ученых, в процессе тестирования DM21 превзошла по точности все существующие подходы для ведения квантовых расчетов при вычислении энергии связей в молекулах.
#Deepmind#физика
⚽️ Специалисты по ИИ из DeepMind, дочерней компании Google, обучили роботов играть в футбол.
При помощи нейросетей они двигаются на 180% быстрее обычных андроидов с заранее прописанными командами. Механические футболисты научились отражать удары, защищать ворота и быстро вставать при падении.
Также они стали чаще забивать голы и предугадывать движения соперников.
#DeepMind#Google#роботизация
Иногда появляется ощущение, что жизнь вокруг ИИ происходит в режиме быстрой перемотки. Меньше месяца назад Мета выпустила SAM для сегментации любых объектов на изображении, но такое ощущение, что это было всегда. Только за последние 2 дня я уже прочитал около десятка документов, описывающих прототипы использования SAM для изучения недр.
Например, на первых двух картинках (из этого поста) - берем шлиф(срез породы) -> пропускаем через SAM -> выделяем все зерна пород -> автоматически получаем распределение размера зерен (гранулометрия).
На последней картинке я просто кликнул мышкой и выделил все пыльцевые зерна на изображении полученном с помощью электронного микроскопа. Автоматически выделенные зерна можно классифицировать и использовать палеотнологами для определения геологического возраста породы.
#machinelearning#Geo
💬 Команда исследователей из Google Research и DeepMindразработали медицинского чат-бота с искусственным интеллектом MedPaLM.
Система представляет собой большую языковую модель, которая использует семь различных наборов данных, охватывающих результаты профессиональных врачебных осмотров, исследования и ответы на вопросы пациентов. Проанализировав запрос алгоритм способен предложить несколько «безопасных и полезных» вариантов решений медицинской проблемы.
По словам ученых, по качеству ответов ИИ-система превосходит аналогичные модели, но пока уступает врачам-клиницистам.
🔎 В процессе тестирования MedPaLM дала 93% правильных ответов, в то время как подобный алгоритм Flan-PaLM оказался точным только в 63% случаев.
#Google#DeepMind#чатботы
Atlas получает «мозг» от Google. Начало новой эры для роботов? 🤖🧠
Boston Dynamics и Google DeepMind объявили о стратегическом партнерстве, цель которого — соединить лучшее «тело» с передовым «интеллектом» для создания роботов нового поколения.
Суть коллаборации:
➡️За «физику» (железо, динамические движения, «атлетический интеллект») отвечает Boston Dynamics.
➡️За «когнитивные способности» (восприятие, рассуждение, планирование, взаимодействие) — Google DeepMind, который интегрирует в Atlas свои мультимодальные ИИ-модели Gemini Robotics.
Почему это важно?
Цель — научить робота Atlas не просто ходить и поднимать грузы до 50 кг, а понимать окружающий мир, безопасно работать рядом с людьми и обучаться новым задачам на производстве. Первым полигоном станет автопром: Hyundai (основной акционер Boston Dynamics) планирует начать внедрение роботов на своих заводах с 2028 года.
Что дальше?
Первые коммерческие роботы Atlas уже в 2026 году отправятся в исследовательские центры Google DeepMind и на тестовые площадки Hyundai. Это партнерство может стать тем самым рывком, который переведет гуманоидных роботов из категории впечатляющих прототипов в реальные инструменты для промышленности.
#ИИ#Робототехника#BostonDynamics#Google#DeepMind#Atlas#Gemini#Инновации#Автопром
https://t.me/semasci