TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #1089 · 5.05

Сегодня закрыли Skype после 22 лет работы, ушла эпоха. Когда-то мне приходила в голову такая мысль: если подростком вы пошли в кино на фильм с взрослыми известными актёрами, то вероятнее всего в какой-то момент прочитаете новость о смерти каждого из них. Вот и с сервисами — нашему поколению суждено читать новости о смерти того, чем мы пользовались в школе, университете, в более молодые годы. Я вот застал смерть Flash, ICQ (и QIP), ATI (видеокарты), мобильных веток Nokia и Siemens, Башорга и Лурка, НародРу, SonyEricsson, Motorola, WinAmp. Есть вещи, которые номинально существуют, но в любом значимом смысле из практического поля вышли: ЖЖ, Rambler, FlyBoard... Интересно, что десктопный софт, похоже, крепче, чем интернет-сервисы. Помню в школе начинал изучать 3D max, тогда ещё принадлежавший фирме Discreet, и вот он до сих пор живее всех живых, правда уже под эгидой Autodesk. Даже Blender его не убил, что не перестаёт меня удивлять. Или MS Office — всех нас переживёт, похоже. Microsoft в своё время сделали превосходную ставку, догадавшись оцифровать самую базовую офисную рутину. В 2025 году у нас везде ИИ и SPA с формами, но в бухгалтерию ты всё равно кидаешь docx-файл со вставленным сканом собственной подписи. Погуглил: даже Dreamweaver существует и обновляется, помните такой? Для меня он всегда будет продуктом Macromedia. Да, я был там, Гэндальф, 3000 лет назад. А эти ваши интернет-сервисы мрут, как мухи. Текстам в интернете каюк (и тексто-ориентированным соцсетям, как следствие). Фотки ещё держатся, но уже в основном на телефонах: никто не переживает от отсутствия вменяемой версии Инсты для десктопа. Видео... уверен, мы застанем ещё убийство Ютуба короткими вертикальными роликами. Возможно сайт по домену «Ютуб» будет открываться, но не такой, как сейчас. А дальше, думаю, когда смартфоны научатся посылать бессодержательный электрический импульс прямо в центр удовольствия, тогда уже и короткие видео пропадут. Сколько из того, чем я пользуюсь сейчас каждый день, сохранится через 10, 20 лет? 50? Вот и посмотрим. Skype RIP, о тебе только хорошие воспоминания, хоть и недолгие. #web

Hashtags

Резултати

Намерени 1 подобни публикации

Търсене: #bfl

当前筛选 #bfl清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #9625 · 05.03.2026 г., 13:26

🌟Self-Flow: обучение диффузионных моделей без внешних энкодеров от Black Forest Labs. Black Forest Labs и MIT решили проблему, с которой сталкиваются диффузионные и flow-модели: чтобы генерировать качественные картинки, им нужны сильные семантические представления. Обычно их берут снаружи - выравнивают внутренние признаки модели с признаками энкодера вроде DINOv2. Метод работает, но есть нюанс. Чем сильнее энкодер, тем хуже результат: в экспериментах замена DINOv2-B на более мощный DINOv3-H+ стойко ухудшала FID. Модель привязывалась к фиксированным внешним представлениям и переставала масштабироваться. На видео и аудио выравнивание с энкодерами V-JEPA2 и MERT вообще давало результат хуже ванильного flow matching. 🟡Self-Flow предлагает механизм Dual-Timestep Scheduling В стандартном flow matching все токены нойзятся одинаково, поэтому модель решает задачу локально и не учится строить глобальные связи. Self-Flow сэмплирует 2 разных уровня шума и случайно назначает их разным токенам (часть входа зашумлена сильнее, часть чище). Это создает асимметрию: чтобы восстановить сильно зашумленные токены, модель вынуждена опираться на чистые и строить глобальный контекст. Поверх этого работает самообучение по принципу дистилляции. Обучаются одновременно 2 копии модели: модель-ученик видит смешанный зашумленный вход, модель-учитель - более чистую версию (EMA-копия с экспоненциальным скользящим средним). Ученик учится предсказывать признаки учителя из зашумленного входа, и это вынуждает его развивать сильные семантические представления без какого-либо внешнего энкодера. 🟡Результаты тестов 🟢На ImageNet 256×256 Self-Flow показал FID 5.70 против 5.89 у REPA; Это, кстати, первый случай, когда self-supervised метод превзошел внешнее выравнивание на этом бенче 🟢На text-to-image: FID 3.61 против 3.92 у REPA; 🟢По видео: FVD 47.81 против 49.75 у REPA; 🟢По аудио: лучшие FAD-оценки среди всех вариантов. При этом на масштабировании (с 290M до 1B) разрыв с REPA увеличивается: модель Self-Flow на 625M параметров обходит REPA на 1B. Метод универсален для модальностей - он работает одинаково на картинках, видео и аудио, что намекает на применение для мультимодального обучения. В репозитории проекта есть код инференса на основе SiT-XL/2 с per-token timestep conditioning, чекпоинт на основе ImageNet 256×256 и скрипты для генерации сэмплов под FID-оценку через ADM evaluation suite. Поддерживаются режимы SDE и ODE, мульти-GPU через torchrun. 🟡Статья 🟡Техотчет 🖥GitHub @ai_machinelearning_big_data #AI#ML#Multimodal#Framework#BFL