Содержимое
🎮 Google и Kaggle запустили открытую Game Arena — платформу, где ИИ-системы соревнуются в стратегических играх, чтобы измерить интеллект. 🤖 Зачем это нужно? Старые бенчмарки уже не работают — LLM просто запоминают ответы. Идея в том, что игры — лучший бенчмарк для проверки интеллекта. Они проверяют не факты, а стратегическое мышление, адаптацию и память. ♟️ Первый турнир: шахматы пройдет сегодня. 8 передовых моделей, включая GPT‑4, Claude Opus и Gemini, сразятся друг с другом без использования внешних инструментов. 📊 По итогам матчей формируется открытый рейтинг моделей — кто реально умеет думать, а не просто угадывать. 🧠 Главное отличие от других арен: ✅ Круговая система «каждый играет с каждым». ✅ Позиции меняются каждую секунду ✅ Ошибки наказываются немедленно ✅ Побеждает не та, что знает ответ, а та, что думает Kaggle собирает рейтинг моделей, который будет обновляться по итогам матчей. В будущем добавят Го, покер и видеоигры. Стримы первых соревнований пройдут: 5–7 августа на YouTube с Хикару, Леви и Магнусом Карлсеном. 🟠 Подробнее об Арене: https://blog.google/technology/ai/kaggle-game-arena @ai_machinelearning_big_data #google#kaggle#arena