TGTGInsightаналитика telegramLIVE / telegram public index
Содержимое поста
Содержимое
Обучение ассоциациям “сигнал–награда” управляется мезолимбическим дофамином, который передает ошибку предсказания награды. Традиционные модели предполагают, что больше пар “сигнал–результат” за фиксированное время усиливает обучение. Однако в экспериментах на мышах показано, что скорость обучения пропорциональна интервалу между наградами (или наказаниями), а общее обучение за фиксированное время не зависит от числа опытов. Модель ретроспективного обучения на основе дофамина объясняет эти результаты, предлагая единый механизм биологического обучения. https://www.nature.com/articles/s41593-026-02206-2