Post #525

@MachineLearningResearch

AML

Views424Post view count

PostedDec 512/05/2025, 12:26 PM

Post content

Анализ по LLM в 2025 году – эмпирический анализ 100.000.000.000.000 токенов на основе метаданных платформы OpenRouter Монополий на ИИ-модели больше нет, рынок фрагментирован Ни одна модель не удерживает больше 25 % рынка открытого кода Крупнейшие игроки по объему токенов: DeepSeek — 14.370.000.000.000 (но доминирование разрушено) Qwen — 5.590.000.000.000 Meta LLaMA — 3.960.000.000.000 Mistral AI — 2.920.000.000.000 Minimax — 126.000.000.000.000 Открытые модели выросли с почти 0 до ~30 % всех токенов за 2 года Рынок стал по-настоящему мультимодельным Китай — новый глобальный экспортёр Ml-инфраструктуры Об этом писали ранее Их открытые модели в отдельные недели доходили до 30 % мирового использования (в среднем 13 % за год) Доля Азии в глобальных расходах на Ml выросла с 13 % до 31 % за два года Это уже экспорт открытых весов и дешёвой мощности по всему миру Русский язык — в тройке лидеров мира (2.47 %) всех токенов после английского (82.87 %) и китайского (4.95 %) Третье место — это очень высокий показатель для неанглоязычного сообщества Но отчёт не углубляется по задачам/моделям для русского Как люди реально используют Ml в 2025: - Программирование — больше 50 % всех токенов к концу года - Ролевые игры, интерактивные истории, творчество — второй по величине сегмент - Перевод, образование, здоровье — значительно меньше Получается, что Ml используют не только (и даже не столько) для «продуктивности», сколько для кодинга и развлечений Модели с рассуждением — уже стандарт Более 50 % всех токенов обрабатываются моделями, которые «думают» перед ответом и используют инструменты Средний контекст вырос в 3–4 раза (в программировании часто 20–100K+ токенов) Цена почти не влияет на спрос Снижение цены на 10 % даёт рост использования всего на 0.5–0.7 % Люди платят не за дешевизну, а за то, что модель идеально решает их конкретную задачу Эффект «хрустальной туфельки» Если модель с первого раза идеально подошла под задачу пользователя — он остаётся с ней навсегда Когорты Gemini 2.5 Pro (июнь 2025) и Claude 4 Sonnet (май 2025) сохраняют ~40 % активных пользователей через 5–6 месяцев Поздние когорты тех же моделей — в разы хуже. Первая любовь решает всё Ниши уже сформировались: - Anthropic Claude — 60–80 % всего программирования - DeepSeek — 60 % + ролевых игр и казуальных диалогов - xAI Grok Code Fast, Qwen 3 Coder — быстро отъедают долю в коде - Gemini Flash — рабочая лошадка для массового объёма Универсального лидера больше не будет