TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #673 · 29.11

Сейчас идёт международное голосование The Game Awards 2022 за игру года. И там видно, что год довольно скудный: если присутствие в топе Elden Ring ещё можно понять, то, например, Stray в топ-4 это странно. Не поймите меня неправильно, Stray — отличная игра, и я прошёл её с удовольствием. Но ни её масштаб, ни качество реализации, ни уникальность механик не тянут на какой-то абсолютный топ лучших игр за год. Наличие же там очередной версии Майнкрафта и мультяшного платформера Sonic Frontiers говорит само за себя. Вообще, игровая индустрия сейчас переживает упадок из-за двух больших процессов, связанных с деньгами. Во-первых, идёт смещение от, условно, "умных" жанров к "глупым". Вместо сюжетных игр делают сессионки. Полностью умирает жанр RTS. Интересные механики и сложные повествования всё чаще встречаются только где-нибудь в инди. Просто потому, что простейшую (с точки зрения когнитивной нагрузки) стрелялку можно продать существенно бОльшим тиражом, чем стратегию. Когда-то игры были уделом небольшой кучки гиков, среди которых много всяких интеллектуалов и любителей порешать задачки. Но сейчас это массовое развлечение-жвачка. Выгодно делать то, что купит больше людей. Во-вторых, активная монополизация рынка: крупные компании очень агрессивно скупают компании поменьше. А где не могут поглотить, там подписывают соглашения о слиянии. Крупные компании так залиты деньгами из-за успешных продаж массовой жвачки, что самое эффективное применением этим деньгам — купить всех конкурентов. Так "выиграть" конкуренцию проще, чем рискуя на эти же деньги разрабатывать продукт, который ещё может провалиться. А если конкуренты куплены, то конкуренции нет, а, значит, нет разнообразия. Поэтому среди дорогих и высокобюджетных проектов выходит мало интересного и много однообразно-привычного типа батлфилдов и колофдьютей каждый год. На этом фоне и очень простенький Stray это яркое явление, и казуальный платформер не выглядит чем-то плохим, и даже инди-рогалику Cult Of The Lamb хватило просто быть адекватно нарисованным, а не очередным пиксельартом (механики у многих инди хорошие, а в топы они не попадают, на мой взгляд, как раз из-за графики и бюджетного продакшена). #games

Hashtags

Резултати

Намерени 1 подобни публикации

Търсене: #bfl

当前筛选 #bfl清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #9625 · 05.03.2026 г., 13:26

🌟Self-Flow: обучение диффузионных моделей без внешних энкодеров от Black Forest Labs. Black Forest Labs и MIT решили проблему, с которой сталкиваются диффузионные и flow-модели: чтобы генерировать качественные картинки, им нужны сильные семантические представления. Обычно их берут снаружи - выравнивают внутренние признаки модели с признаками энкодера вроде DINOv2. Метод работает, но есть нюанс. Чем сильнее энкодер, тем хуже результат: в экспериментах замена DINOv2-B на более мощный DINOv3-H+ стойко ухудшала FID. Модель привязывалась к фиксированным внешним представлениям и переставала масштабироваться. На видео и аудио выравнивание с энкодерами V-JEPA2 и MERT вообще давало результат хуже ванильного flow matching. 🟡Self-Flow предлагает механизм Dual-Timestep Scheduling В стандартном flow matching все токены нойзятся одинаково, поэтому модель решает задачу локально и не учится строить глобальные связи. Self-Flow сэмплирует 2 разных уровня шума и случайно назначает их разным токенам (часть входа зашумлена сильнее, часть чище). Это создает асимметрию: чтобы восстановить сильно зашумленные токены, модель вынуждена опираться на чистые и строить глобальный контекст. Поверх этого работает самообучение по принципу дистилляции. Обучаются одновременно 2 копии модели: модель-ученик видит смешанный зашумленный вход, модель-учитель - более чистую версию (EMA-копия с экспоненциальным скользящим средним). Ученик учится предсказывать признаки учителя из зашумленного входа, и это вынуждает его развивать сильные семантические представления без какого-либо внешнего энкодера. 🟡Результаты тестов 🟢На ImageNet 256×256 Self-Flow показал FID 5.70 против 5.89 у REPA; Это, кстати, первый случай, когда self-supervised метод превзошел внешнее выравнивание на этом бенче 🟢На text-to-image: FID 3.61 против 3.92 у REPA; 🟢По видео: FVD 47.81 против 49.75 у REPA; 🟢По аудио: лучшие FAD-оценки среди всех вариантов. При этом на масштабировании (с 290M до 1B) разрыв с REPA увеличивается: модель Self-Flow на 625M параметров обходит REPA на 1B. Метод универсален для модальностей - он работает одинаково на картинках, видео и аудио, что намекает на применение для мультимодального обучения. В репозитории проекта есть код инференса на основе SiT-XL/2 с per-token timestep conditioning, чекпоинт на основе ImageNet 256×256 и скрипты для генерации сэмплов под FID-оценку через ADM evaluation suite. Поддерживаются режимы SDE и ODE, мульти-GPU через torchrun. 🟡Статья 🟡Техотчет 🖥GitHub @ai_machinelearning_big_data #AI#ML#Multimodal#Framework#BFL