TGTGInsighttelegram intelligenceLIVE / telegram public index
Содржина
Содржина на објавата
Qwen 3.7-Max превосходит Opus 4.7 и GPT-5.5 (в независимом тесте) Какие-то ребята протестировали три модели на задаче с агентами: написать бота для игры в Tetris, который будет играть в игру и обучаться самостоятельно. Каждая модель могла читать свой собственный код, запускать тесты производительности и переписывать себя в течение 10 итераций. Затем сравнили финальные боты напрямую. 🇭🇰 Qwen 3.7-Max: стоимость обучения 1,32 доллара, улучшение бота +56%. 💬 Claude Opus 4.7: стоимость обучения 12,15 доллара, улучшение бота +28%. 👨💻 GPT-5.5: стоимость обучения 2,85 доллара, улучшение бота +7%. Qwen выиграл по всем параметрам.