Post #450

@MachineLearningResearch

AML

Views389Post view count

PostedNov 1011/10/2025, 04:56 PM

Post content

Логическое мышление: как большие языковые модели научились логическим рассуждениям без больших финансовых и временных затрат Исследователи из T-Bank AI Research и лаборатории Центрального университета Omut AI представили метод, который позволяет развивать сложные reasoning-навыки без полного переобучения — своего рода «точной настройке» логических цепочек в уже обученной сети В основе подхода лежит не “переписывание мозга”, а steering vectors — компактные векторы-регуляторы, которые усиливают корректные логические шаги модели На шести математических бенчмарках метод показал сохранение 100 % эффективности полного дообучения при изменении всего 0.0016 % параметров 14-миллиардной модели Требования к памяти сократились с гигабайтов до сотен килобайт Скорость одного из этапов обучения увеличилась с десятков минут до секунд Logit-анализ показывает усиление ключевых маркеров логических рассуждений — таких как “потому что”, “следовательно”, “правильно” В связи с этим поведение LLM становится легче интерпретировать исследователям, которые получают прозрачный инструмент для изучения того, как именно модель рассуждает Результаты исследования протестировали на моделях Qwen и LLaMA и представили на EMNLP 2025 Steering LLM Reasoning Through Bias-Only Adaptation