TGTGInsighttelegram intelligenceLIVE / telegram public index
← Linuxgram 🐧

TGINSIGHT SIMILAR POSTS

Sib kontenut simili

Kanal tas-sors @linuxgram · Post #17841 · Fra 19

📰 AI Helped Uncover A "50-80x Improvement" For Linux's IO_uring Linux block maintainer and IO_uring lead developer Jens Axboe recently was debugging some slowdowns in the AHCI/SCSI code with IO_uring usage. When turning to Claude AI to help in sorting through the issue, patches were devised that can deliver up to a "literally yield a 50-80x improvement on the io_uring side for idle systems." The code is on its way to the Linux kernel... 🔗 Source: https://www.phoronix.com/news/AI-50-80x-IO-uring #linux#kernel

Riżultati

2 postijiet simili nstabu

Tfittxija: #i2v

当前筛选 #i2v清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #9277 · 18/12/2025 13:41

🌟TurboDiffusion: ускорение генерации видео в 100+ раз. Суровая реальность нашего времени: вы хотите сгенерировать 5-секундное видео на большой SOTA-модели. Вы запускаете промпт, идете пить кофе, возвращаетесь, а процесс все еще идет. И зачастую генерация может занимать больше часа. Главные виновники - чудовищная вычислительная сложность механизма внимания в трансформерах, необходимость сотен шагов денойзинга и огромный объем памяти для весов в полной точности. Авторы проекта TurboDiffusion из Цинхуа и Беркли решили собрать все эффективные методы сжатия и ускорения в один пайплайн. Их идея заключалась в том, что разреженность и квантование — это техники, которые не мешают друг другу. 🟡Архитектура держится на 3-х китах оптимизации: 🟢Заменили стандартное внимание на гибрид из SageAttention2++ и Sparse-Linear Attention (SLA), который превратил квадратичную сложность в линейную. чтобы модель фокусировалась только на важных токенах. 🟢Дистиллировали сэмплинг через rCM - вместо стандартных 50–100 шагов модель приходит к результату всего за 3-4 шага без потери сути изображения. 🟢Перевели и веса и активации линейных слоев в INT8 используя блочное квантование, чтобы не потерять точность. В довершении ко всему смогли объединить после файнтюнинга под SLA и дистилляции rCM веса в единую модель, избежав конфликтов. 🟡Результаты бенчмарков выглядят как опечатка, но это не она. На RTX 5090 время генерации для тяжелой модели Wan2.2-I2V 14B упало с 69 минут до 35.4 секунд. А для более легкой Wan 2.1-1.3B - с почти 3-х минут до 1.8 секунды. Это ускорение больше чем в 100 раз. При этом, судя по примерам, визуальное качество осталось практически неотличимым от оригинала. 📌Лицензирование: Apache 2.0 License. 🟡Набор моделей 🟡Техотчет 🖥GitHub @ai_machinelearning_big_data #AI#ML#I2V#T2V#TurboDiffusion

Ядерный апгрейд для WAN: FusionX — видео в два раза быстрее и краше! 🔥 Название модели: Wan2.1_14B_FusionX Ссылка на модель: https://civitai.com/models/1651125?modelVersionId=1868891 Тип модели: #Checkpoint#Merge Количество скачиваний: 8.8k+ Дата загрузки: 6 июня 2025 Базовая модель: Wan Video 14B t2v Теги:#merge, #wan, #i2v, #t2v, #wan14b, #video, #cinematic, #animation, #speed Описание модели | Комментарий разработчика: Это мощный чекпоинт, созданный слиянием базовой модели WAN 2.1 14B и нескольких передовых моделей (CausVid, AccVideo, MoviiGen1.1). Результат — значительное улучшение качества движения, плавности сцены и детализации, сопоставимое с закрытыми коммерческими аналогами. Главное преимущество — ускорение рендеринга до 50% по сравнению с базовой моделью, особенно при включении SageAttn. Модель отлично подходит для генерации как из текста, так и из изображения, и полностью совместима с VACE. Автор также выпустил LoRA-версию для тех, кто предпочитает гибкость и контроль. Помимо основной Text2Video модели, на странице доступны и другие версии: отдельная для Image2Video, а также квантованные GGUF-варианты для экономии VRAM. Идеальный выбор, чтобы быстро создавать качественные и выразительные кинематографичные ролики. Важные настройки: Модель не требует триггерных слов, но для качественного результата критически важны следующие параметры: CGF должен быть установлен на 1. Shift: Для разрешения 1024x576 начинайте с 1, для 1080x720 — с 2. Для большего реализма используйте низкие значения, для стилизации — более высокие (3-9). Шаги: 8–10 шагов для оптимального качества. 🤖НЕЙРО-СКЛАД — всё, что нужно, для твоей нейронки!