@hiaimediaes · Post #1050 · 08/09/2025, 12:07 AM
♟ o3 derrota a Grok 4 en la final del torneo de ajedrez El modelo o3 de OpenAI barrió a Grok 4 con un marcador de cuatro juegos a cero en la final del primer torneo de ajedrez entre modelos de lenguaje, celebrado del 5 al 7 de agosto en la plataforma Kaggle Game Arena. El evento fue organizado por Google DeepMind y Kaggle. Se prohibió el uso de motores de ajedrez e Internet durante el torneo. La final fue comentada en vivo por Magnus Carlsen, el 16º Campeón Mundial de Ajedrez. "o3 es bastante implacable en las conversiones, parece un jugador de ajedrez. Grok parece que aprendió algunos movimientos de apertura y conoce las reglas, pero no mucho más",comentó. Según Carlsen, el enfrentamiento entre los modelos de lenguaje se asemejabaa juegos infantiles. Los modelos frecuentemente dejaban piezas colgadas y realizaban movimientos impulsivos. Carlsen estimó la fuerza de Grok en aproximadamente 800 Elo y la de o3 en unos 1,200, lo que corresponde a jugadores de nivel principiante. En comparación, Carlsen tiene una calificación superior a 2,800, mientras que los motores de ajedrez más fuertes superan los 3,500. El tercer lugar fue para Gemini 2.5 Pro de Google, que venció a o4-mini de OpenAI en el partido por el bronce. También participaron Gemini 2.5 Flash, Claude Opus 4, DeepSeek R1 y Kimi k2. ♟ ¿Por qué es importante? El objetivo del torneo es probar las capacidades de razonamiento estratégico de los modelos. Google busca establecer Kaggle Game Arena como un punto de referencia definitivo con clasificaciones estrictas. Por ahora, incluso el motor de ajedrez del Atari 2600de los años 70 puede superar a los modelos de lenguaje actuales. Los chatbots no están diseñados para tácticas ni para calcular miles de líneas; para ellos, un juego de ajedrez es solo texto que intentan navegar. 🔜 Mira la final aquí. #noticias#ajedrez@hiaimediaes