Post #8715

@ai_machinelearning_big_data

Machinelearning

Просмотры33,900Количество просмотров

Опубликован8 окт.08.10.2025, 09:42

Содержимое поста

Содержимое

🧩 Новая архитектура нейросетей от Samsung: Tiny Recursive Model (TRM) - обошла DeepSeek-R1, Gemini 2.5 Pro и o3-mini в задачах рассуждения ARC-AGI 1 и ARC-AGI 2. ✔️ Размер модели - всего 7 миллионов параметров и около 1000 обучающих примеров. Это меньше в 10 000 раз, чем у современных LLM, но результат лучше. Как работает TRM: 1️⃣Черновой ответ: модель сразу формирует быстрый набросок решения, а не пишет его по словам. 2️⃣Скрачпад: создаёт внутреннее пространство для логики и промежуточных рассуждений. 3️⃣Самокритика: многократно (6 раз) проверяет свои рассуждения, уточняя и исправляя ошибки. 4️⃣Переписывание: на основе улучшённой логики создаёт новую, более точную версию ответа. 5️⃣Цикличность: повторяет процесс до 16 раз, пока не достигнет уверенного, логически цельного решения. 💡 Чем интересна модель: - Меньше затрат на вычисления, а результат выше; высокая эффективность при низких издержках. - Доказательство того, что собственная логика и архитектура могут быть сильнее простого размера модели. Можно коротко описать ее: «думай, прежде чем действовать». - Мощные рассуждающие системы становятся доступными даже без огромных кластеров, модель можно запускать на ограниченных ресурсах. Это не просто «компактаная LLM», это другой способ мышления: модель, которая действительно *думает, прежде чем говорить*. 🟠Статья: https://arxiv.org/abs/2510.04871v1 🟠Github: https://github.com/SamsungSAILMontreal/TinyRecursiveModels @ai_machinelearning_big_data #TinyRecursiveModels#TRM#DeepLearning#NeuralNetworks