TGTGInsightаналитика telegramLIVE / telegram public index
← ИИволюция 👾
ИИволюция 👾 avatar

TGINSIGHT POST

Post #1339

@ai_volution

ИИволюция 👾

Просмотры3,730Количество просмотров
Опубликован10 июл.10.07.2025, 05:10
Содержимое поста

Содержимое

Grok-4 Только что на стриме xAI Илон Маск и команда показали Grok-4. Новая SOTA? – На Humanity’s Last Exam Grok 4 Heavy набрал 50,7%. Это больше чем в два раза выше, чем у прошлых лидеров. Gemini 2.5 Pro набирал только 22%. – С инструментами (tools) обычный Grok 4 даёт 41%, без инструментов — 26,9%. – Инструменты (tool use) встроены прямо в обучение. Модель реально использует браузер, интерпретатор кода и прочие внешние сервисы. – Стал лучше голосовой режим. Grok теперь может не только говорить, но и шептать, петь (на видео выше, грок исполняет оперу о диетической Коле), менять интонации и эмоции. – В чате доступны сразу две версии: обычная (для всех) и Grok Heavy (выбивает 100% на AIME 2025, RIP очередной бенчмарк 🎩). – За Grok Heavy — 300 долларов в месяц. – В вендинг-бенче (тут писал, как Claude обанкротился изначально став бизнесменом) Grok 4 заработал $4694 и продал больше 4500 товаров. Для сравнения: Claude Opus смог только $2077. Grok сам принимал решения, как закупать и по каким ценам продавать. Кажется, что в ближайший год большие оптимизации коснутся больших ритейлеров. – Grok 4 уже сегодня доступен через xAI API. Контекст 256k токенов, мультимодальный reasoning, поиск по реальным данным, безопасность для бизнеса (не обучается на данных компаний). – Grok 4 первый, кто пробил 10% на ARC-AGI v2 (там 15,9%). В ARC-AGI v1 — 66,6%. Это лучший результат среди всех LLM. – В медицине тоже топ! На X-ray бенчмарке Grok 4 даёт 72,8%. Выше всех остальных моделей. – Модель уже умеет собирать 3D-игры. Grok сам находит ассеты, подбирает текстуры и добавляет 3D-модели в движок. Что дальше? – В августе выйдет отдельная кодовая модель. – В сентябре появится мультимодальный агент. – В октябре будет модель для генерации видео. Всё это будет частью Grok 4. xAI говорят, что Grok 4 уже лучше многих PhD по всем предметам. И обещают новые технологии и даже открытия в физике в ближайшие пару лет. Мощная заявка и кажется у нас есть новый тариф в $300, к которому скорее всего этим летом подтянутся остальные игроки. Чтож, Сэм, пора выпускать монстра GPT-5. Заждались!