TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #500 · 11.08

В ЛентеРу вышла статья о том, что ВК поставила рекорд по посещаемости и по просмотрам видеороликов. Давайте вместо разбора статьи я вам цитату из классики приведу. «Как будто в подтверждение его слов телекран у них над головами сыграл фанфару. Но на этот раз была не победа на фронте, а сообщение министерства изобилия. — Товарищи! — крикнул энергичный молодой голос. — Внимание, товарищи! Замечательные известия! Победа на производственном фронте. Итоговые сводки о производстве всех видов потребительских товаров показывают, что по сравнению с прошлым годом уровень жизни поднялся не менее чем на двадцать процентов. <...> Телекран все извергал сказочную статистику. По сравнению с прошлым годом стало больше еды, больше одежды, больше домов, больше мебели, больше кастрюль, больше топлива, больше кораблей, больше вертолетов, больше книг, больше новорожденных — всего больше, кроме болезней, преступлений и сумасшествия. С каждым годом, с каждой минутой все и вся стремительно поднималось к новым и новым высотам. <...> Завершив фанфарой сводку из министерства изобилия, телекран заиграл бравурную музыку. Парсонс от бомбардировки цифрами исполнился рассеянного энтузиазма и вынул изо рта трубку. — Да, хорошо потрудилось в нынешнем году министерство изобилия, — промолвил он и с видом знатока кивнул. — Кстати, Смит, у вас, случайно, не найдется свободного лезвия? — Ни одного, — ответил Уинстон. — Полтора месяца последним бреюсь.» Джордж Оруэлл, «1984» #web

Hashtags

Резултати

Намерени 1 подобни публикации

Търсене: #optimizatio

当前筛选 #optimizatio清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8587 · 19.09.2025 г., 09:09

🚀 SakanaAI представил Robust Agentic CUDA Kernel Optimization Это новый подход, где LLM помогает оптимизировать CUDA-ядра для PyTorch. • Слияние операций ускоряет forward/backward-проходы, результаты выше стандартных Torch-базлайнов • Полный пайплайн: PyTorch → генерация CUDA-кода → эволюционная оптимизация во время работы • Проверка через LLM: модели автоматически отмечают неправильные ядра (дает +30% к производительности) • robust-kbench — собственный бенчмарк, где измеряют не только скорость, но и корректность работы LLM Авторы пишут о 2.5x ускорении над PyTorch eager и даже 6x в линейных операциях❗️ Но большинство примеров — это тесты на слияние операций с неотюненной базой, так что цифры спорные. К тому же PyTorch 2.5 уже внедряет похожие оптимизации ), поэтому такие рекорды могут быстро обесцениться. Это интересный подход к самообучающимся AI-компиляторам, но заявленные ускорения стоит проверять на праактике. 🟢Github: https://github.com/SakanaAI/robust-kbench 🟢Статья: https://arxiv.org/abs/2509.14279 @ai_machinelearning_big_data #AI#CUDA#PyTorch#SakanaAI#LLM#Optimizatio