Post #8619

@ai_machinelearning_big_data

Machinelearning

Просмотры34,700Количество просмотров

Опубликован24 сент.24.09.2025, 14:29

Содержимое поста

Содержимое

🧠 MIT доказал: LLM могут логически рассуждать, если правильно их учить. 📄 Исследователи предложили метод PDDL-INSTRUCT. Он превращает обучение модели из «угадай ответ» в пошаговое решение задач с внешней проверкой. Как это устроено: 1️⃣ На первом этапе модели показывают правильные и неправильные планы с объяснениями. 2️⃣ На втором этапе она сама прописывает рассуждения для каждого шага. После этого внешний инструмент (**VAL**) проверяет логику. Если ошибка - модель получает чёткое объяснение, что не так. 📊 Результаты: - У Llama-3-8B точность выросла с 28% до 94% на задачах планирования. - Подробная обратная связь работает намного лучше, чем простое «правильно/неправильно». 💡 Главное: модель не заменяет символический планировщик, а учится мыслить как он, сохраняя внешнюю проверку. ⚡ Такой подход можно применить к любым многошаговым задачам - от математики до программирования. Возможно, многие «невозможные» способности моделей скрыты внутри и ждут правильного метода обучения. 🟠Статья: https://arxiv.org/abs/2509.13351 @machinelearning_interview