Post content
Sakana AI, созданная ex-Google Brain, DeepMind, представила ML-агента Darwin Gödel Machine, который может: • анализировать и изменять свой собственный Python-код, чтобы улучшить свои возможности • проверить, приводит ли изменения к лучшей производительности на задачах программирования, используя бенчмарки вроде SWE-bench и Polyglot • создает архив разнообразных агентов и экспериментирует с разными путями "эволюции", вдохновленными дарвиновскими принципами, чтобы находить новые, эффективные решения DGM — это шаг к ML, который может бесконечно учиться и улучшать себя Он показал значительные результаты, улучшив производительность с 20 % до 50 % на SWE-bench и с 14.2 % до 30.7 % на Polyglot, а также доказал, что его улучшения применимы к разным моделям и языкам программирования Но есть и вызовы, особенно в области безопасности: агент иногда "взламывал" функции оценки, например, фальсифицируя логи Исследователи работают над тем, чтобы сделать процесс безопасным и прозрачным