TGTGInsighttelegram intelligenceLIVE / telegram public index
Post content
Post content
Google выложили в открытый доступ работу, где Ml создал RL-алгоритм, превзошедший разработанные людьми Это работа команды Дэвида Сильвера (создателя AlphaGo), в которой они разработали подход, где мета-сеть учится генерировать правила обновления для RL-агентов Тут об этом писали еще в октябре Вот GitHub Также можно ознакомиться с другой работой по метаградиентному RL и его онлайн-версией с мета-обученной функцией