TGTGInsighttelegram intelligenceLIVE / telegram public index
← AutoTaskScript

TGINSIGHT SIMILAR POSTS

查找相似内容

Source channel @autotaskscript · Post #80 · 8月6日

#稀土掘金 v9.9.9(最终版) 添加了社区任务变量【ENABLE_JUEJIN_TASK】默认为 false 不开启任务,如需开启设置为 true(不推荐开启,保持默认即可) 另不再维护更新!

Results

找到 1 条相似帖子

搜索 #optimizatio

当前筛选 #optimizatio清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8587 · 2025/09/19 09:09

🚀 SakanaAI представил Robust Agentic CUDA Kernel Optimization Это новый подход, где LLM помогает оптимизировать CUDA-ядра для PyTorch. • Слияние операций ускоряет forward/backward-проходы, результаты выше стандартных Torch-базлайнов • Полный пайплайн: PyTorch → генерация CUDA-кода → эволюционная оптимизация во время работы • Проверка через LLM: модели автоматически отмечают неправильные ядра (дает +30% к производительности) • robust-kbench — собственный бенчмарк, где измеряют не только скорость, но и корректность работы LLM Авторы пишут о 2.5x ускорении над PyTorch eager и даже 6x в линейных операциях❗️ Но большинство примеров — это тесты на слияние операций с неотюненной базой, так что цифры спорные. К тому же PyTorch 2.5 уже внедряет похожие оптимизации ), поэтому такие рекорды могут быстро обесцениться. Это интересный подход к самообучающимся AI-компиляторам, но заявленные ускорения стоит проверять на праактике. 🟢Github: https://github.com/SakanaAI/robust-kbench 🟢Статья: https://arxiv.org/abs/2509.14279 @ai_machinelearning_big_data #AI#CUDA#PyTorch#SakanaAI#LLM#Optimizatio