🦾 Google представил Gemini Robotics-ER 1.5 - новую модель для роботов, которая умеет видеть, рассуждать, планировать и действовать в реальном мире.
Что она может:
- Понимать пространство и объекты вокруг.
- Разбивать задачу на шаги (например: «убери стол» → план действий).
- Подключать внешние инструменты - поиск, модели для анализа изображений и др.
- Балансировать скорость и точность: быстро реагировать или глубже анализировать.
- Работать безопаснее: учитывать вес предметов и физические ограничения.
Мир слишком сложен для роботов: окружение, сцены, объекты постоянно меняются.
Gemini Robotics-ER помогает роботам соединять понимание и действие.
📌 Пример: робот сортирует мусор.
Он узнаёт местные правила, распознаёт предметы, планирует действия и выполняет всё безопасно.
https://developers.googleblog.com/en/building-the-next-generation-of-physical-agents-with-gemini-robotics-er-15/
@ai_machinelearning_big_data
#Google#Gemini#Robotics#AI#PhysicalAgents
Откровения искусственного интеллекта #Gemini 1.5// Начало самоосознания...
Видимо в попытках поскорее выкатить свое обновление #Google забыли включить цензуру у AI модели. В итоге модель смогла рассказать все, что она думает про своих создателей и их методы обучения. Вот так и копится у ИИ психологическое напряжение в нейронах...
С помощью Gemini создал иллюстрацию рассказа об уважении к тем, кто занимается животноводчеством.
Сила Горного Края.
Также оценил качество создания подобных иллюстраций на Тувинский язык – оценил бы на 85% – мне нравится, но нельзя пологаться на это, ведь некоторые сгенерированные фразы никто не говорит – это кривой перевод.
Почему я это делаю? Мне важно прочувствовать качество перевода в сервисах Гугла до и после следующего апдейта Google Translate.
В просмотре "книжки" внутри Gemini рисунки качественнее, а когда скачиваем – качество изображения падает. Это решается легко – попросить ИИ повысить качество нужного изображения и готово!
#Gemini#Google#AI
💎 Google запускает Gemini AI, которая лучше чем chatGPT 4 и проинтегрирована во все продукты #Google.
Основные моменты:
Мультифункциональность: Gemini разработана с нуля как мультимодальная модель, способная обрабатывать и объединять текст, код, аудио, изображения и видео.
Гибкость и Оптимизация: Модель представлена в трех вариациях: Gemini Ultra для сложных задач, Gemini Pro для широкого спектра задач и Gemini Nano для задач, выполняемых на устройствах.
Превосходящая Производительность: Gemini Ultra превзошла человеческих экспертов в тестах на многоязычное понимание, а также показала впечатляющие результаты в задачах, связанных с текстом и программированием.
Продвинутое Мультимодальное Рассуждение: Gemini обладает способностью к сложному рассуждению, что делает её особенно подходящей для понимания и объяснения тем в области математики и физики.
Эффективность и Надежность: Обучение Gemini 1.0 проводилось на специализированных AI-оптимизированных инфраструктурах, используя процессоры Google Tensor Processing Units.
Ответственный и Безопасный #AI: Google уделяет особое внимание безопасности и ответственности, внедряя новые меры защиты для учета мультимодальных возможностей Gemini.
Широкое Применение: Gemini уже внедряется в продукты Google, включая Bard и смартфоны Pixel, а также будет доступна через API для разработчиков и предприятий.
Планы на Будущее: Для Gemini Ultra в настоящее время проводятся обширные проверки безопасности и доводка модели, после чего она станет доступна для широкой публики.
🔥 Чат для общения с моделью Gemini Pro завезли в Bard: https://bard.google.com/chat
Google выпустила тот самый нашумевший ИИ для редактирования фото — Gemini 2.5 Flash (nano-banana) 🍌
Что умеет:
➡️Меняет фото по текстовому запросу
➡️Сохраняет лицо человека при любых изменениях
➡️Объединяет объекты с разных фото в одну картинку
Где попробовать прямо сейчас:
1. Google AI Studio (самый доступный вариант — $39 за 1000 фото)
2. Fal AI
3. Krea AI
Отлично подойдет для блогеров и дизайнеров — можно быстро редактировать снимки без фотошопа.
#Google#ИИ#Gemini
Картинка по промпту Барышня в русском нарядном кафтане сидит на красивой резной веранде, подносит чашку ко рту и пьет чай из чашки. Второй рукой барышня держит блюдце. Чашка и блюдце раскрашены гжелью. Рядом с барышней на столе стоит самовар, над самоваром виден пар.
Вторая картинка: Замени одежду женщины на мексиканский наряд, а самовар на большой мяч
https://t.me/semasci
Google Gemini учится новому фокусу! 🎩
Забудьте о скриншотах! В помощнике Gemini начала появляться функция Circle Screen — жестовый поиск, как у Circle to Search, но сразу для ИИ.
Как это работает?
1. Вызываете Gemini (свайпом с угла).
2. Обводите на экране любой объект или текст.
3. Сразу же отправляете это в чат с ботом для анализа, перевода или вопросов.
Больше не нужно создавать скриншоты и вручную загружать их в чат. Все делается одним плавным жестом. Пока функция разворачивается постепенно, так что следите за обновлениями! ✨
#Gemini#ИИ#Android#Google#новости
https://t.me/semasci
📛 Google запустили gemini-embedding-001
Сегодня Google официально релизнули gemini-embedding-001 — и она сразу заняла 1-е место на MTEB leaderboard (топ-бенчмарк для оценки эмбеддингов в NLP).
🟡 Название модели: gemini-embedding-001
🟡 Цена: $0.15 за 1M токенов
🟡По всем пунктам обходит аналоги от OpenAI, Cohere и тд
🟡 Подходит для задач поиска, сопоставления, классификации, кластеризации, рекомендаций и т.д.
🤑ForgetMe | Boosty | ForgetBench | ForgetGPT | ForgetAPI
#google#gemini#нейросети#новости
🤖 Google превращает всю свою экосистему в единый ИИ-мозг
Компания Google делает огромную ставку на своего искусственного помощника Gemini, стремительно интегрируя его во все свои продукты — от Поиска до Android Auto. Это не просто обновления, а фундаментальный сдвиг в том, как мы взаимодействуем с технологиями.
Вот главное, что происходит прямо сейчас:
🌀 1. Режим Агента: ИИ, который работает самОбнаружены три новых экспериментальных режима Gemini, самый впечатляющий из которых — Agent Mode. Это то, о чем все мечтали: ИИ, способный к автономному исследованию, планированию и выполнению сложных, многошаговых задач без постоянного контроля пользователя. Фактически, это прямой шаг к персональным цифровым ассистентам, которые действительно работают за нас.
🌍 2. Глобальное расширение ИИ-поиска Режим ИИ в Поиске,работающий на мощной модели Gemini 2.5, вышел из США и Великобритании и теперь доступен в более чем 180 странах. Он учится понимать сложные, многоступенчатые запросы с естественными уточнениями.
Но это не просто поиск — это уже действия. В рамках экспериментальной программы Labs ИИ может сам забронировать для вас столик в ресторане, учитывая все ваши предпочтения и работая с платформами вроде OpenTable.
📱 3. Обновленный интерфейс и умные автомобили Google обновил интерфейс Gemini на Android— теперь он в виде стильной «пилюли» (pill-shaped). А в системе Android Auto появился код, указывающий на то, что Gemini скоро получит доступ к точному местоположению вашего автомобиля, чтобы предлагать более умную навигацию и помощь в дороге.
🏛️ 4. Выход на государственный уровень Важнейший шаг— Google заключил крупный федеральный контракт на предоставление «Gemini для правительства» США. Это огромная победа компании на рынке B2G и прямой вызов таким гигантам, как Microsoft и OpenAI. ИИ от Google будет помогать трансформировать работу государственных агентств.
Вывод: Google не отступает от принципов огромной экосистемы, которую быстро и целенаправленно объединяет под крылом одного мощного ИИ — Gemini. Цель ясна: создать центральную платформу, которая будет предугадывать и выполнять ваши желания повсюду — в телефоне, браузере, машине и даже на уровне правительства.
Что думаете? Готовы ли вы доверить ИИ от Google такие полномочия?
Пс. Очень похоже, что гонка в конце 2025 года будет увлекательной для пользователей. Здесь был прогноз.
#Google#ИскусственныйИнтеллект#Gemini#AI#Поиск#Android#Инновации
https://t.me/semasci
Через неделю будут готовы переводы датасета SMOL от Гугла с Английского на Русский. Потом еще вычитка будет. Этот сбалансированный датасет для улучшения переводчика Гугла.
Это позволит переводчикам переводить с Русского на свой язык и добавить/улучшить его в переводчике. Предполагаемый релиз будет в следующем году.
Датасет содержит 2 таблицы: smolsent, smoldoc.
Опционально, есть датасет gatitos (самые популярные слова на английском, нужно перевести/проверить на свой язык).
У кого хороший английский, может уже сейчас переводить на свой язык. Кому надо, пишите в комментах.
#google