TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #53 · 23.06

Instagram запустил у себя ТикТок (назвал его Reels) и так же агрессивно, как ВК, впаривает пользователям: у некоторых уже заменилась самая главная кнопка — создание нового поста — на иконку Reels. Но здесь у меня меньше бомбит, чем от действий ВК. Во-первых, в инстаграме короткие видеоролики выглядят уместно. Они здесь и раньше были в основной ленте, просто теперь фактически то же самое в новом интерфейсе. «Соцсеть» с самого своего основания сконцентрирована на коротком жвачкоподобном контенте без вдумчивости. Во-вторых, инстаграм уже давно был, прямо скажем, не самым внимательным к пользователю сервисом. Некоторые люди ведут его вопреки, потому что там массовая аудитория (менее взыскательная), но плюются от неудобства и бестолковых ограничений. А кто мог терпеть всё, что там делалось, стерпит и кнопку. Куда показательнее другой момент: корпорации-монополисты могут позволить себе делать ну практически что угодно. И если в экономике монополию стараются пресекать специальными законами, но монополии различных сервисов и соцсетей живут себе спокойно. Причём, при наличии социального графа такие монополии очень прочны: вы можете вместо айфона купить себе андроид сегодня же, и ваших друзей это затронет слабо, но переехать из какого-нибудь Фейсбука в ВК так просто не выйдет. Именно поэтому мы видим ситуации, когда самым популярным становится сервис, уступающий конкурентам вообще по всем показателям, и на порядок менее удобный (например WhatsApp и Telegram). И поэтому, в числе прочего, крупные игроки строят экосистемы и пытаются создать внутри себя копии популярных решений конкурентов. Если привязать пользователя и сделать процесс ухода для него сложным и некомфортным, то потом можно ему хоть рекламой всё забивать, хоть кнопки менять, хоть глупые функции добавлять в главное меню — никуда он уже не денется, скушает за милую душу. В антиутопическом будущем по такому же принципу корпорации будут вшивать людям лишние предметы в тело, а те вместо отказа от услуг станут придумывать способы, как с этими предметами жить наиболее эффективно. Ещё и курсы откроют по обучению: «Раскрутка с топором в заднем проходе», «Как набрать первую воду в мешок на шее» и «Учимся таргетировать магнит в кишках на правильные объекты». #web

Hashtags

Резултати

Намерени 1 подобни публикации

Търсене: #bfl

当前筛选 #bfl清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #9625 · 05.03.2026 г., 13:26

🌟Self-Flow: обучение диффузионных моделей без внешних энкодеров от Black Forest Labs. Black Forest Labs и MIT решили проблему, с которой сталкиваются диффузионные и flow-модели: чтобы генерировать качественные картинки, им нужны сильные семантические представления. Обычно их берут снаружи - выравнивают внутренние признаки модели с признаками энкодера вроде DINOv2. Метод работает, но есть нюанс. Чем сильнее энкодер, тем хуже результат: в экспериментах замена DINOv2-B на более мощный DINOv3-H+ стойко ухудшала FID. Модель привязывалась к фиксированным внешним представлениям и переставала масштабироваться. На видео и аудио выравнивание с энкодерами V-JEPA2 и MERT вообще давало результат хуже ванильного flow matching. 🟡Self-Flow предлагает механизм Dual-Timestep Scheduling В стандартном flow matching все токены нойзятся одинаково, поэтому модель решает задачу локально и не учится строить глобальные связи. Self-Flow сэмплирует 2 разных уровня шума и случайно назначает их разным токенам (часть входа зашумлена сильнее, часть чище). Это создает асимметрию: чтобы восстановить сильно зашумленные токены, модель вынуждена опираться на чистые и строить глобальный контекст. Поверх этого работает самообучение по принципу дистилляции. Обучаются одновременно 2 копии модели: модель-ученик видит смешанный зашумленный вход, модель-учитель - более чистую версию (EMA-копия с экспоненциальным скользящим средним). Ученик учится предсказывать признаки учителя из зашумленного входа, и это вынуждает его развивать сильные семантические представления без какого-либо внешнего энкодера. 🟡Результаты тестов 🟢На ImageNet 256×256 Self-Flow показал FID 5.70 против 5.89 у REPA; Это, кстати, первый случай, когда self-supervised метод превзошел внешнее выравнивание на этом бенче 🟢На text-to-image: FID 3.61 против 3.92 у REPA; 🟢По видео: FVD 47.81 против 49.75 у REPA; 🟢По аудио: лучшие FAD-оценки среди всех вариантов. При этом на масштабировании (с 290M до 1B) разрыв с REPA увеличивается: модель Self-Flow на 625M параметров обходит REPA на 1B. Метод универсален для модальностей - он работает одинаково на картинках, видео и аудио, что намекает на применение для мультимодального обучения. В репозитории проекта есть код инференса на основе SiT-XL/2 с per-token timestep conditioning, чекпоинт на основе ImageNet 256×256 и скрипты для генерации сэмплов под FID-оценку через ADM evaluation suite. Поддерживаются режимы SDE и ODE, мульти-GPU через torchrun. 🟡Статья 🟡Техотчет 🖥GitHub @ai_machinelearning_big_data #AI#ML#Multimodal#Framework#BFL