TGTGInsighttelegram intelligenceLIVE / telegram public index
Содржина
Содржина на објавата
Super Mario Bros, как способ потестить модель на эффективность Исследователи из Hao AI Lab поставили перед ведущими LLM задачку: поиграть в Super Mario. Используя фреймворк GamingAgent, модели обрабатывали игру кадр за кадром, получая только базовые инструкции. Цель? Планируйте, реагируйте и разрабатывайте стратегию. Результаты: – Лучше всех затащил Клодовский Сонет 3.7 – Хуже всех – модели с большим количеством рассуждений, такие как o1 Оказалось, что быстрая реакция иногда побеждает глубокую логику.