TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #621 · 31.10

У меня в друзьях есть классный автор — Владимир Бычко. Владимир — проект-менеджер, ведёт реально интересный standalone-блог об управлении проектами и не только. Например, последний пост с правилами жизни — не какая-то унылая несовместимая с реальностью псевдофилософия "а ля Дуров", а действительно полезные и правильные наблюдения. Владимир один из самых интересных авторов среди моих ВК-подписок, однако, читаю я его посты крайне редко, и здесь проявляются серьёзные недостатки standalone, о чём я сейчас расскажу. Вообще, сервис-ориентированный интернет если не умирает, то, как минимум, теряет своих сторонников. Многие айтишники, интеллектуалы, авторы текстов уже высказываются о необходимости слезать с иглы корпораций, эти самые корпорации дешевеют, люди в сети активно выстраивают модели децентрализованного "веб три ноль". Дополнением к этому идёт акцент на медиа против текстов: сервисы уже не особо скрывают, что текстовая часть для них второстепенна, а внимание брошено туда, где хайп и толпы — например, в вертикальные видео и короткоживущий контент. В России этот эффект особенно заметен, именно поэтому вместо какой-нибудь устойчивой текстовой площадки большинство взрослых вменяемых авторов пишут в Telegram. Который для этого подходит чуть лучше, чем плоскогубцы для отвинчивания гаек — можно, конечно, и все мы так делали за неимением альтернатив. На этой волне неоднократно слышал призывы "уходи в standalone". Сделай свой сайт с RSS-фидом, любым оформлением, пиши туда. Как автор блога, я и правда мог бы такое сделать и даже видеть немало плюсов. Но, как читатель, я до сих пор не подписан ни на один standalone-блог, даже если мне очень нравится контент. Проанализировал основные четыре проблемы стэндэлонов. 1. Люди всё равно приходят из соцсетей, но ссылки в соцсетях оформлены некрасиво, понижаются в охватах и требуют дополнительное действие со стороны человека. Последнее особенно важно: конверсия в прочтение критически низкая даже для встроенных редакторов лонгридов и даже при условии, что пользователю сообщение со ссылкой покажется (например Telegram > Telegraph). 2. RSS это не замена ленте сообщений. Нет удобного централизованного способа читать RSS в формате той площадки, которая тебе близка. Сам Владимир, например, ссылается на RSS-бота для Телеграма, который требует для своей работы быть подписанным на какой-то канал. Ну ладно, есть нормальные RSS-боты везде, но это всё опять же выглядит как лента с внешними ссылками, а не как лента сообщений в формате площадки. 3. У каждого стэндэлона свой дизайн. Если я впервые на странице нового для себя автора ВК или в Telegram, я тут всё знаю. Мне привычно и удобно. Я знаком с навигацией, я привык к шрифтам, я знаю, где лайки и комментарии. К каждому новому стэндэлону нужно привыкать и тратить когнитивные ресурсы на обучение. 4. Обсуждений нет, если нет комьюнити. Да, какой-нибудь Вастрик смог создать вокруг своего стэндэлон-блога комьюнити, за которое люди даже платят. Но это единичные примеры. Обсуждения в ЖЖ работали, потому что был социальный граф: люди знали топовых авторов и более менее знали друг друга. Обсуждения в соцсетях работают по той же причине, пока в них есть аудитория: часть людей связана социальным графом, другая часть может в этот граф заходить со стороны и чувствовать себя комфортно, кроме случаев токсичной атмосферы. Но если мы проанализируем, как ведут себя обсуждения там, где социального графа нет (например, на YouTube), то увидим просто всплески очень ограниченных локальных диалогов под каким-то особо популярным комментарием и всё. Комьюнити там нет за редкими исключениями. Интернету пока ещё точно рано standalone. Только авторы, уже собравшие огромную аудиторию через соцсети, могут себе такое позволить. И то, с оговорками. #web

Hashtags

Резултати

Намерени 1 подобни публикации

Търсене: #bfl

当前筛选 #bfl清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #9625 · 05.03.2026 г., 13:26

🌟Self-Flow: обучение диффузионных моделей без внешних энкодеров от Black Forest Labs. Black Forest Labs и MIT решили проблему, с которой сталкиваются диффузионные и flow-модели: чтобы генерировать качественные картинки, им нужны сильные семантические представления. Обычно их берут снаружи - выравнивают внутренние признаки модели с признаками энкодера вроде DINOv2. Метод работает, но есть нюанс. Чем сильнее энкодер, тем хуже результат: в экспериментах замена DINOv2-B на более мощный DINOv3-H+ стойко ухудшала FID. Модель привязывалась к фиксированным внешним представлениям и переставала масштабироваться. На видео и аудио выравнивание с энкодерами V-JEPA2 и MERT вообще давало результат хуже ванильного flow matching. 🟡Self-Flow предлагает механизм Dual-Timestep Scheduling В стандартном flow matching все токены нойзятся одинаково, поэтому модель решает задачу локально и не учится строить глобальные связи. Self-Flow сэмплирует 2 разных уровня шума и случайно назначает их разным токенам (часть входа зашумлена сильнее, часть чище). Это создает асимметрию: чтобы восстановить сильно зашумленные токены, модель вынуждена опираться на чистые и строить глобальный контекст. Поверх этого работает самообучение по принципу дистилляции. Обучаются одновременно 2 копии модели: модель-ученик видит смешанный зашумленный вход, модель-учитель - более чистую версию (EMA-копия с экспоненциальным скользящим средним). Ученик учится предсказывать признаки учителя из зашумленного входа, и это вынуждает его развивать сильные семантические представления без какого-либо внешнего энкодера. 🟡Результаты тестов 🟢На ImageNet 256×256 Self-Flow показал FID 5.70 против 5.89 у REPA; Это, кстати, первый случай, когда self-supervised метод превзошел внешнее выравнивание на этом бенче 🟢На text-to-image: FID 3.61 против 3.92 у REPA; 🟢По видео: FVD 47.81 против 49.75 у REPA; 🟢По аудио: лучшие FAD-оценки среди всех вариантов. При этом на масштабировании (с 290M до 1B) разрыв с REPA увеличивается: модель Self-Flow на 625M параметров обходит REPA на 1B. Метод универсален для модальностей - он работает одинаково на картинках, видео и аудио, что намекает на применение для мультимодального обучения. В репозитории проекта есть код инференса на основе SiT-XL/2 с per-token timestep conditioning, чекпоинт на основе ImageNet 256×256 и скрипты для генерации сэмплов под FID-оценку через ADM evaluation suite. Поддерживаются режимы SDE и ODE, мульти-GPU через torchrun. 🟡Статья 🟡Техотчет 🖥GitHub @ai_machinelearning_big_data #AI#ML#Multimodal#Framework#BFL