Содержимое
🇺🇸#технологии#ИИ 👉 OpenAI признала, что её новая модель галлюцинирует в 37% случаев. Такой результат компания получила по итогам тестирования своей новейшей модели 4.5 на внутреннем бенчмарке SimpleQA. 👉 И это считается отличным результатом, так как бюджетная o3-mini и вовсе "сочиняет" в 80,3% ответов. 🤣 🤔 Это демонстрирует системную проблему отрасли: дорогостоящие, ресурсо-затратные модели позиционируются как инструменты, приближающиеся к человеческому интеллекту, но часто ошибаются в базовых фактах. 🤷♂️ Главный вывод состоит в том, что сегодняшним ИИ-моделям нельзя доверять полностью. При этом производительность моделей OpenAI выходит на плато. 👉 Тем временем, OpenAI планирует 👉взимать до $20000 в месяц за специализированных ИИ-агентов. ❓ Как считаете, попрёт? 😂👇