Post #371

@MachineLearningResearch

AML

Views77Post view count

PostedOct 810/08/2025, 10:26 AM

Post content

Ml-модель от Samsung в 10.000 раз меньше DeepSeek и Gemini 2.5 Pro, но при этом умнее и эффективнее Tiny Recursive Model (TRM) — это свежая разработка от Samsung AI Lab в Монреале. Эту работу написал 1 человек GitHub TRM - маленькая модель с 7.000.000 параметров, но несмотря на размер, она обходит гигантов по производительности в сложных задачах на рассуждение Это рекурсивная модель рассуждения, которая упрощает и улучшает предыдущие идеи вроде Hierarchical Reasoning Model (HRM) Модель не просто генерирует ответы на лету, как обычные LLM, а итеративно улучшает свой вывод, имитируя процесс самокритики и доработки TRM тестировали на тяжёлых задачах, где нужны настоящие рассуждения, а не просто запоминание: - ARC-AGI-1: 45 % точности лучше, чем у DeepSeek-R1, Gemini 2.5 Pro и o3-mini. - ARC-AGI-2: 8 % точности (опять обходит тех же гигантов). - Sudoku-Extreme: Обучена на 1.000 примерах, достигла 87.4 % на 423 000 тестовых задачах — без переобучения Почему это хорошо и что меняет? 1. Не нужно тратить миллиарды на GPU и энергию TRM показывает, что архитектура важнее масштаба — рекурсивные циклы позволяют "думать" эффективно, а не brute-force 2. Это шаг к гибридам, где символическая логика сочетается с нейронками 3. Модель учится через «самоанализ», а не через обучение с подкреплением от человека