TGTGInsighttelegram intelligenceLIVE / telegram public index
← AML
AML avatar

TGINSIGHT POST

Post #380

@MachineLearningResearch

AML

Views36Post view count
PostedOct 910/09/2025, 03:48 PM
Post content

Post content

Неужели мы наблюдаем возрождение эволюционных стратегий как альтернативы RL? Я помню ту работу 2017 года от OpenAI и Суцкевера в частности "Evolution Strategies as a Scalable Alternative to Reinforcement Learning" (https://arxiv.org/abs/1703.03864), где впервые ES показали себя достойной альтернативой RL Я сам писал про это в начале 2017 года https://moocaholic.medium.com/2017-the-year-of-neuroevolution-30e59ae8fe18 Но в мир LLM эти подходы так и не пришли, возможно потому что на миллиардах параметров оно сходу не работало Свежая работа "Evolution Strategies at Scale: LLM Fine-Tuning Beyond Reinforcement Learning" https://arxiv.org/abs/2509.24372 устраняет этот пробел Реализация настолько простая, что непонятно, почему это сделали только в 2025-м... https://t.me/gonzo_ML_podcasts/936