TGTGInsightаналитика telegramLIVE / telegram public index
К списку каналов
Machinelearning avatar

TGINSIGHT CHAT

Machinelearning

@ai_machinelearning_big_data

Технологии

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Подписчики31.3万Текущее число подписчиков
Постов1,009Проиндексировано постов
Охват33,900Просмотры последних постов
Последние посты

Последние посты

Тег: #tinyrecursivemodels · 1 постов

当前筛选 #tinyrecursivemodels清除筛选

Опубликован 8 окт.

🧩 Новая архитектура нейросетей от Samsung: Tiny Recursive Model (TRM) - обошла DeepSeek-R1, Gemini 2.5 Pro и o3-mini в задачах рассуждения ARC-AGI 1 и ARC-AGI 2. ✔️ Размер модели - всего 7 миллионов параметров и около 1000 обучающих примеров. Это меньше в 10 000 раз, чем у современных LLM, но результат лучше. Как работает TRM: 1️⃣Черновой ответ: модель сразу формирует быстрый набросок решения, а не пишет его по словам. 2️⃣Скрачпад: создаёт внутреннее пространство для логики и промежуточных рассуждений. 3️⃣Самокритика: многократно (6 раз) проверяет свои рассуждения, уточняя и исправляя ошибки. 4️⃣Переписывание: на основе улучшённой логики создаёт новую, более точную версию ответа. 5️⃣Цикличность: повторяет процесс до 16 раз, пока не достигнет уверенного, логически цельного решения. 💡 Чем интересна модель: - Меньше затрат на вычисления, а результат выше; высокая эффективность при низких издержках. - Доказательство того, что собственная логика и архитектура могут быть сильнее простого размера модели. Можно коротко описать ее: «думай, прежде чем действовать». - Мощные рассуждающие системы становятся доступными даже без огромных кластеров, модель можно запускать на ограниченных ресурсах. Это не просто «компактаная LLM», это другой способ мышления: модель, которая действительно *думает, прежде чем говорить*. 🟠Статья: https://arxiv.org/abs/2510.04871v1 🟠Github: https://github.com/SamsungSAILMontreal/TinyRecursiveModels @ai_machinelearning_big_data #TinyRecursiveModels#TRM#DeepLearning#NeuralNetworks

33,900 views