TGTGInsightаналитика telegramLIVE / telegram public index
← Machinelearning
Machinelearning avatar

TGINSIGHT POST

Post #8392

@ai_machinelearning_big_data

Machinelearning

Просмотры22,300Количество просмотров
Опубликован28 авг.28.08.2025, 19:05
Содержимое поста

Содержимое

🖥 OpenAI представили gpt-realtime: свою самую продвинутую на сегодня модель «речь-в-речь». Цены: > $32 за 1 миллион аудио-входных токенов > ($0.40 за 1 миллион кэшированных входных токенов) > $64 за 1 миллион аудио-выходных токенов 📊 MultiChallenge (Audio), точность следования инструкциям: - gpt-realtime: 30.5% - gpt-4o-realtime-preview-2025-06-03: 26.5% - gpt-4o-realtime-preview-2024-12-17: 20.6% 🎯 ComplexFuncBench (Audio), точность выполнения инструкций по голосу: - gpt-realtime: 66.5% - gpt-4o-realtime-preview-2025-06-03: 58.9% - gpt-4o-realtime-preview-2024-12-17: 49.7% Чем интересна: - Скачок в понимании голосовых инструкций и точном следовании аудио-командам - Меньше косяков в понимании речи - Модель готова для реального продакшена в голосовых ассистентах и колл-ботах GPT-Realtime обучали на качественных данных и с помощью специализированных reward-моделей, звучит очень годно. 🟢Попробовать @ai_machinelearning_big_data