TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #520 · 29.08

У кого-то из фантастов была описана такая сцена: огромный военный космический корабль древней цивилизации патрулирует свои владения, а рядом с ним летит маленький современный (от другой цивилизации) и конвоирует его, чтобы чего лишнего не сделал. Маленький был способен уничтожить большой одним выстрелом. В сцене показана немощность некогда могучей, но безнадёжно устаревшей технологии по сравнению с более новой. Я вспомнил сегодня об этом, когда увидел машину такси, у которой на "шашечках" на крыше был написан красивый семизначный номер телефона. Сама машина стояла припаркованная, с водителем внутри, на стекле была табличка "Свободен" или типа того. Никакой айдентики какого-либо из агрегаторов на корпусе не было. Не знаю, работает ли конкретно этот водитель по-старинке, но мы все таких иногда встречаем на выходе из вокзалов, например. Призраки давно минувших времён. #life

Hashtags

Резултати

Намерени 1 подобни публикации

Търсене: #optimizatio

当前筛选 #optimizatio清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8587 · 19.09.2025 г., 09:09

🚀 SakanaAI представил Robust Agentic CUDA Kernel Optimization Это новый подход, где LLM помогает оптимизировать CUDA-ядра для PyTorch. • Слияние операций ускоряет forward/backward-проходы, результаты выше стандартных Torch-базлайнов • Полный пайплайн: PyTorch → генерация CUDA-кода → эволюционная оптимизация во время работы • Проверка через LLM: модели автоматически отмечают неправильные ядра (дает +30% к производительности) • robust-kbench — собственный бенчмарк, где измеряют не только скорость, но и корректность работы LLM Авторы пишут о 2.5x ускорении над PyTorch eager и даже 6x в линейных операциях❗️ Но большинство примеров — это тесты на слияние операций с неотюненной базой, так что цифры спорные. К тому же PyTorch 2.5 уже внедряет похожие оптимизации ), поэтому такие рекорды могут быстро обесцениться. Это интересный подход к самообучающимся AI-компиляторам, но заявленные ускорения стоит проверять на праактике. 🟢Github: https://github.com/SakanaAI/robust-kbench 🟢Статья: https://arxiv.org/abs/2509.14279 @ai_machinelearning_big_data #AI#CUDA#PyTorch#SakanaAI#LLM#Optimizatio