✔️Google выпустил новый 50-страничный документ о том, как создавать AI-агентов, которые реально работают в практических задачах
Это понятное и структурированное введение в основы агентных систем.
В гайде рассматриваются:
- архитектура агента и его основные компоненты
- роль LLM как «мозга» агента
- подключение и использование инструментов
- оркестрация нескольких агентов
- подходы к деплою и продакшн-интеграции
- метрики и способы оценки работы
- как создаются самообучающиеся и эволюционирующие агенты
- пример архитектуры AlphaEvolve
📌Гайд: https://drive.google.com/file/d/1C-HvqgxM7dj4G2kCQLnuMXi1fTpXRdpx/view
@ai_machinelearning_big_data
#AI#Agents#Google#LLM#MachineLearning#AIResearch
💎 Google запускает Gemini AI, которая лучше чем chatGPT 4 и проинтегрирована во все продукты #Google.
Основные моменты:
Мультифункциональность: Gemini разработана с нуля как мультимодальная модель, способная обрабатывать и объединять текст, код, аудио, изображения и видео.
Гибкость и Оптимизация: Модель представлена в трех вариациях: Gemini Ultra для сложных задач, Gemini Pro для широкого спектра задач и Gemini Nano для задач, выполняемых на устройствах.
Превосходящая Производительность: Gemini Ultra превзошла человеческих экспертов в тестах на многоязычное понимание, а также показала впечатляющие результаты в задачах, связанных с текстом и программированием.
Продвинутое Мультимодальное Рассуждение: Gemini обладает способностью к сложному рассуждению, что делает её особенно подходящей для понимания и объяснения тем в области математики и физики.
Эффективность и Надежность: Обучение Gemini 1.0 проводилось на специализированных AI-оптимизированных инфраструктурах, используя процессоры Google Tensor Processing Units.
Ответственный и Безопасный #AI: Google уделяет особое внимание безопасности и ответственности, внедряя новые меры защиты для учета мультимодальных возможностей Gemini.
Широкое Применение: Gemini уже внедряется в продукты Google, включая Bard и смартфоны Pixel, а также будет доступна через API для разработчиков и предприятий.
Планы на Будущее: Для Gemini Ultra в настоящее время проводятся обширные проверки безопасности и доводка модели, после чего она станет доступна для широкой публики.
🔥 Чат для общения с моделью Gemini Pro завезли в Bard: https://bard.google.com/chat
🧠 Google выпускает крутейшее руководство по созданию AI-агентов!
Инженеры Google представили практическое руководство для всех, кто хочет создавать по-настоящему умные и самостоятельные ИИ-системы.
О чём этот документ?
Раньше ИИ просто реагировал на запросы.Теперь он может самостоятельно ставить цели, планировать и действовать для их достижения. Такие системы называются агентными. Это новый уровень искуственного интеллекта.
Чем это полезно обычному пользователю?
Представьте себе не просто чат-бота, а умного цифрового помощника, который:
✅Сам разбирается с проблемами клиента, задаёт уточняющие вопросы и лезет в базу данных за ответами.
✅Не просто выполняет одну команду, а управляет целым процессом (например, бронирует вам весь отпуск: отель, билеты, экскурсии).
✅Автономно принимает решения, чтобы достичь цели, которую вы ему поставили.
Что внутри?
В руководстве— 21 готовый паттерн (шаблон) для построения таких систем. Это как конструктор для создания сложных ИИ. Всё подкреплено реальными примерами кода.
Коротко о главном:
Это наглядное пособие о том, как заставить ИИ не просто говорить, а делать сложную работу за нас.
#ИИ#AI#Google#Agents#Разработка#Программирование
https://t.me/semasci
Anything
Заявляют что Агент, который занимается разработкой мобильных приложений и веб-сайтов. Дизайн, который не выглядит так, будто его создал ИИ. Всё необходимое уже встроено.
Доступно прямо сейчас,
Можно в X зашерить пост и дадут триалку на неделю
Пост
#agents | AcidCrunch
Perplexity сильно обновился: Deep Research теперь работает на модели Opus 4.5.
Обновление уже доступно для подписчиков Max и Pro. Система показывает рекордную точность в эталонных тестах, особенно в таких сложных областях, как право, медицина и академические исследования.
P.S. Кстати, я до сих пор использую приложение perplexity на кнопке ассистента на телефоне, очень удобно.
#PerplexityAI#ИИ#AIResearch
https://t.me/semasci
Иногда появляется ощущение, что жизнь вокруг ИИ происходит в режиме быстрой перемотки. Меньше месяца назад Мета выпустила SAM для сегментации любых объектов на изображении, но такое ощущение, что это было всегда. Только за последние 2 дня я уже прочитал около десятка документов, описывающих прототипы использования SAM для изучения недр.
Например, на первых двух картинках (из этого поста) - берем шлиф(срез породы) -> пропускаем через SAM -> выделяем все зерна пород -> автоматически получаем распределение размера зерен (гранулометрия).
На последней картинке я просто кликнул мышкой и выделил все пыльцевые зерна на изображении полученном с помощью электронного микроскопа. Автоматически выделенные зерна можно классифицировать и использовать палеотнологами для определения геологического возраста породы.
#machinelearning#Geo
ChatGPT для климатических вопросов и ответов
На Hugging Face есть милейший чат бот, который отвечает на все вопросы, касающиеся климата. Работает с помощью больших языковых моделей и при взаимодействии с ChatGPT API.
Бот обучен в основном на документах межправительственной комиссии по изменению климата (IPCC), поэтому не понимает, когда его спрашивают про что-то другое. Задаете вопрос, получаете развернутый ответ со ссылками на документы IPCC. Это интересный пример внедрения больших языковых моделей обученных на корпусе внутренних документов.
#AI#climate#LLM
Через неделю будут готовы переводы датасета SMOL от Гугла с Английского на Русский. Потом еще вычитка будет. Этот сбалансированный датасет для улучшения переводчика Гугла.
Это позволит переводчикам переводить с Русского на свой язык и добавить/улучшить его в переводчике. Предполагаемый релиз будет в следующем году.
Датасет содержит 2 таблицы: smolsent, smoldoc.
Опционально, есть датасет gatitos (самые популярные слова на английском, нужно перевести/проверить на свой язык).
У кого хороший английский, может уже сейчас переводить на свой язык. Кому надо, пишите в комментах.
#google
🗣 В последних обновлениях политики конфиденциальности Google разрешила сбор общедоступных данных для обучения продуктов на основе искусственного интеллекта.
В версии политики от 1 июля 2023 года сказано, что компания будет собирать данные для обучения ИИ-моделей и развития своих продуктов, таких как Google Translate, Bard и Cloud AI.
#Google