TGTGInsighttelegram intelligenceLIVE / telegram public index
← 凌莞的奇奇怪怪的分享

TGINSIGHT SIMILAR POSTS

查找相似内容

Source channel @ttyUSB0w · Post #1663 · 5月12日

#出售#电子垃圾#zigbee 联系 Clansty ad Astra 价格 18 + 邮费 zigbee USB dongle 基于 TYZS13 EFR32MG13,支持 z2m 和 zha 自己刷机刷炸了,现在寄给闲鱼卖家刷,不想再出两份邮费了,刷完之后直接寄给你。你只要付寄给你的邮费 预览模式,不会发送到频道,请注意,您的用户名需要手动更新才能确保发送时和此处一致。

Results

找到 1 条相似帖子

搜索 #optimizatio

当前筛选 #optimizatio清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8587 · 2025/09/19 09:09

🚀 SakanaAI представил Robust Agentic CUDA Kernel Optimization Это новый подход, где LLM помогает оптимизировать CUDA-ядра для PyTorch. • Слияние операций ускоряет forward/backward-проходы, результаты выше стандартных Torch-базлайнов • Полный пайплайн: PyTorch → генерация CUDA-кода → эволюционная оптимизация во время работы • Проверка через LLM: модели автоматически отмечают неправильные ядра (дает +30% к производительности) • robust-kbench — собственный бенчмарк, где измеряют не только скорость, но и корректность работы LLM Авторы пишут о 2.5x ускорении над PyTorch eager и даже 6x в линейных операциях❗️ Но большинство примеров — это тесты на слияние операций с неотюненной базой, так что цифры спорные. К тому же PyTorch 2.5 уже внедряет похожие оптимизации ), поэтому такие рекорды могут быстро обесцениться. Это интересный подход к самообучающимся AI-компиляторам, но заявленные ускорения стоит проверять на праактике. 🟢Github: https://github.com/SakanaAI/robust-kbench 🟢Статья: https://arxiv.org/abs/2509.14279 @ai_machinelearning_big_data #AI#CUDA#PyTorch#SakanaAI#LLM#Optimizatio