Садржај поста
🗣️ Google научила Gemini 2.5 понимать и передавать эмоции в диалогах На конференции Google I/O 2025 представлена новая версия мультимодальной модели Gemini 2.5, теперь поддерживающая генерацию аудио и диалогов в реальном времени. Эта функция уже доступна разработчикам через Google AI Studio и Vertex AI. ✔Gemini 2.5 Flash Preview обеспечивает реалистичное голосовое взаимодействие с ИИ: модель распознаёт эмоции, адаптирует интонацию, акцент и поддерживает 24+ языков. Система игнорирует фоновые шумы и может использовать «Поиск» для получения актуальной информации. ✔Модель также предлагает расширенные возможности синтеза речи: настройку стиля, темпа и эмоциональной выразительности, а также генерацию диалогов с несколькими голосами — это открывает новые горизонты для подкастов и аудиокниг. 🔘Вся сгенерированная аудиопродукция маркируется технологией SynthID для прозрачности. Gemini 2.5 объединяет текст, изображения, аудио и видео, открывая новые возможности для интерактивных приложений и виртуальных ассистентов.