Post content
Неужели мы наблюдаем возрождение эволюционных стратегий как альтернативы RL? Я помню ту работу 2017 года от OpenAI и Суцкевера в частности "Evolution Strategies as a Scalable Alternative to Reinforcement Learning" (https://arxiv.org/abs/1703.03864), где впервые ES показали себя достойной альтернативой RL Я сам писал про это в начале 2017 года https://moocaholic.medium.com/2017-the-year-of-neuroevolution-30e59ae8fe18 Но в мир LLM эти подходы так и не пришли, возможно потому что на миллиардах параметров оно сходу не работало Свежая работа "Evolution Strategies at Scale: LLM Fine-Tuning Beyond Reinforcement Learning" https://arxiv.org/abs/2509.24372 устраняет этот пробел Реализация настолько простая, что непонятно, почему это сделали только в 2025-м... https://t.me/gonzo_ML_podcasts/936