Post #1398

@ai_volution

ИИволюция 👾

Просмотры3,800Количество просмотров

Опубликован1 авг.01.08.2025, 12:39

Содержимое поста

Содержимое

Gemini 2.5 Deep Think — возможно, самое мощное обновление от Google DeepMind за всё лето. Google добавил в свою модель новый режим размышлений. По сути, это как если бы нейросеть перестала торопиться, начала рассматривать проблему с разных сторон, строить гипотезы, сравнивать варианты и только потом выдавать ответ. Взвешенное решение! И, кажется, это отлично работает. Результаты в тестах: – AIME 2025 (математика) — 99.2% – LiveCodeBench (кодинг) — 87.6% – HLE — 34.8% – IMO 2025 — 60.7% (это уже медаль по олимпиадным стандартам) Главная фишка Deep Think — параллельное мышление. Модель одновременно «думает в нескольких направлениях»: пробует разные подходы, комбинирует, отбрасывает лишнее и в итоге приходит к лучшему варианту. Плюс в обучении применили reinforcement learning с наградой за длинные и глубокие размышления. Модель буквально учат думать не быстро, а правильно. Как в книге Канемана 😀 Один из тестов, моделям дали задачу: «Построй HTML-сцену с восточным храмом, деревьями и объемной структурой», — Gemini Flash выдал базу, Pro собрал что-то приличное, а Deep Think выдал полноценную, детализированную и логичную сцену. Теперь остаётся ждать выхода GPT-5. Будет ли ответ достойным? Скоро узнаем.