🔥 Google DeepMind представили новую open-source библиотеку на Python для сборки асинхронных AI‑пайплайнов в реальном времени!
Новая библиотека позволяет собирать AI-процессы из компонентов — как LEGO для ИИ-агентов.
🔧 Особенности:
- Построение асинхронных, компонуемых пайплайнов
- Поддержка Gemini и Gemini Live API
- Основана на asyncio
- Обрабатывает мультимодальные данные: текст, изображения, аудио
- Внутри готовые агенты: real-time агент, исследователь, live-комментатор
💡 Подходит для:
- Разработки ИИ-агентов
- Генеративных моделей, работающих в реальном времени
- Быстрой сборки MVP с мультимодальными возможностями
Установка:
pip install genai-processors
Открытый код, готовые компоненты и интеграция с API.
• Repo: https://github.com/google-gemini/genai-processors
• Blog: https://developers.googleblog.com/en/genai-processors/
@ai_machinelearning_big_data
#DeepMind#ai#ml
ИИ не умеет шутить — к такому выводу пришли эксперты Google DeepMind после исследования, в рамках которого 20 комикам предложили написать стендап-материал с применением чат-ботов вроде ChatGPT и Bard.
Проблемы, с которым столкнулся ИИ:
◽️ ему не хватает человечности, которая делала бы материал забавным;
◽️ он не понимает культурный контекст;
◽️ он не понимает, что такое сарказм, черный юмор или ирония;
◽️ из-за настроек модерации ИИ подвержен определенному уровню цензуры.
#DeepMind
Polymathic - междисциплинарный ИИ
Ох, какая классная межуниверситетская инициатива - Polymathic🔥.
Задача, которую они решают, заключается в создании ИИ моделей, которые используют информацию из наборов данных различных модальностей и разных научных областей, которые не имеют общего представления (например, текста). Такие модели могут использоваться в качестве надежных базовых показателей или можно сделать файн-тьюнинг для конкретных приложений. Такой подход может демократизировать ИИ в науке, предоставляя более сильные априорные модели для общих концепций, таких как причинность, измерение, обработка сигналов, и т.п.
В общем история с базовыми и генеративными моделями понемногу адаптируется к научным задачам, за что мы топим тоже 🤘. Реальных проектов пока немного, но есть, например, Multiple Physics Pretraining - подход к разработке больших предобученных физических суррогатных моделей или AstroClip - видимо модель CLIP для астрофизиков.
На данный момент кроме команды ученых есть и крутой консультативный совет, например, с Яном Лекуном (Yann LeCun) из Meta AI.
#AI#ML
🤖DeepMindразработала ИИ-чат-бота Sparrow, обученного на большой языковой модели Chinchilla.
Система предназначена для общения с людьми и ответов на вопросы, используя поиск Google. На основе отзывов от пользователей, Sparrow учится генерировать более полезные диалоги, заявили разработчики.
📝 Чтобы предотвратить опасные или оскорбительные сообщения, инженеры собрали экспериментальную группу и попросили участников выбрать несколько ответов модели на один и тот же вопрос. На основе полученных данных исследователи сформировали 23 правила, которых придерживались при доработке чат-бота.
В итоге Sparrow не дает финансовых советов, ведет себя дружелюбно и не притворяется личностью.
👾 Однако модель все еще допускает ошибки, отметили в DeepMind. Время от времени Sparrow уходит от темы или выдумывает случайные ответы. Некоторые участники также смогли обойти ограничения чат-бота.
#DeepMind#NLP
♟YouTubeприменил освоивший настольные игры ИИ-алгоритм MuZero от DeepMind для улучшения сжатия видео.
В компании заявили, что модель снизила битрейт в среднем на 4% без заметной потери качества роликов. По словам исследователя DeepMind Антона Жернова, это значительная экономия вычислительной мощности и пропускной способности. ИИ может помочь жителям стран с ограниченным интернетом смотреть ранее недоступные для них видео, добавил эксперт.
💬 Жернов уточнил, что MuZero работает только с тем YouTube-контентом, где используется метод сжатия видео с открытым исходным кодом VP9, для улучшения которого алгоритм и адаптировался.
#YouTube#DeepMind
🔎 Исследователи из DeepMind совместно с физиками-теоретиками из Испании и Германии разработали нейросеть DM21, которая просчитывает поведение молекул на квантовом уровне. Она доступна на GitHub.
Алгоритм обучили на данных о квантовых структурах множества разных молекул. Он способен оценивать примерную плотность электронов и вычислять силу взаимодействия между ними.
ИИ натренировали распознавать характерные особенности в структуре молекул, чтобы минимизировать погрешность в определении плотности и других свойств ее электронов.
☝️ По словам ученых, в процессе тестирования DM21 превзошла по точности все существующие подходы для ведения квантовых расчетов при вычислении энергии связей в молекулах.
#Deepmind#физика
⚽️ Специалисты по ИИ из DeepMind, дочерней компании Google, обучили роботов играть в футбол.
При помощи нейросетей они двигаются на 180% быстрее обычных андроидов с заранее прописанными командами. Механические футболисты научились отражать удары, защищать ворота и быстро вставать при падении.
Также они стали чаще забивать голы и предугадывать движения соперников.
#DeepMind#Google#роботизация
#AI
Немного ИИ-теории
❗️В недавнем иске против компании OpenAI Илон Маск утверждал, что GPT-4 является ранним AGI, по сути равным человеческому интеллекту.
Что же такое AGI и когда он появится?
👤Сэм Альтман, CEO Open AI определяет AGI (artificial general intelligence) как интеллект, равный уровню обычного человека, который можно было бы принять в команду как сотрудника. Также популярно определение AGI как «системы, способной выполнить любую когнитивную задачу, доступную человеку».
📎Для справки: существует несколько видов (уровней развития) ИИ, а именно узкий ИИ (narrow, ANI), общий ИИ (genreal, AGI) и супер ИИ (super AI, ASI).
⏲Исследователи никак не могут прийти к консенсусу относительно даты появления AGI. По результатам Expert Survey on Progress in AI, существует 50% шанс того, что AGI появится до 2059 года. Тем не менее, поле ИИ изменяется постоянно и становится сложным оставаться в курсе событий.
⭐️Для этого мы нашли крупнейшее русскоязычное AGI-сообщество agirussia.org — у них есть канал и группа в Telegram.
🌐еще проходят еженедельные онлайн-семинары по тематике AGI на русском языке, записи семинаров за последние несколько лет доступны на YouTube и их сообществе в ВК.
Держим руку на пульсе ИИ⭐
⭐️Автор, Анна, @qcuqueen
💬 Команда исследователей из Google Research и DeepMindразработали медицинского чат-бота с искусственным интеллектом MedPaLM.
Система представляет собой большую языковую модель, которая использует семь различных наборов данных, охватывающих результаты профессиональных врачебных осмотров, исследования и ответы на вопросы пациентов. Проанализировав запрос алгоритм способен предложить несколько «безопасных и полезных» вариантов решений медицинской проблемы.
По словам ученых, по качеству ответов ИИ-система превосходит аналогичные модели, но пока уступает врачам-клиницистам.
🔎 В процессе тестирования MedPaLM дала 93% правильных ответов, в то время как подобный алгоритм Flan-PaLM оказался точным только в 63% случаев.
#Google#DeepMind#чатботы
Хакатончик от Xeek
Two Birds, One Neural Network - так называется новый хакатон от Xeek в области Generative AI. Звучит как-будто нужно сделать свой Dalle-E2, но на самом деле, задача выглядит немного иначе. По условиям хакатона, участникам нужно сделать нейронную сеть, которая максимизирует разнообразие генерируемых результатов, отвечающих двум условиям. Авторы хакатона проводят параллели с добавлением двух геофизических измерений для ограничения сценариев геологических моделей. Буквально, нужно построить нейронную сеть, которая генерирует разнообразные значения x0, x1, сохраняя при этом их природу в виде нисходящих или восходящих прямых линий, удовлетворяющих заданным функциям y1, y2, как показано на картинке.
Более подробное описание - тут. Призовой фонд $40К (первое место $19.5K).
#hackathon#AI#ML