Post #554

@MachineLearningResearch

AML

Views40Post view count

PostedDec 1512/15/2025, 07:06 PM

Post content

Google выложили в открытый доступ работу, где Ml создал RL-алгоритм, превзошедший разработанные людьми Это работа команды Дэвида Сильвера (создателя AlphaGo), в которой они разработали подход, где мета-сеть учится генерировать правила обновления для RL-агентов Тут об этом писали еще в октябре Вот GitHub Также можно ознакомиться с другой работой по метаградиентному RL и его онлайн-версией с мета-обученной функцией