TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #522 · 31.08

Криптобиржа SudoRare установила мировой рекорд по скоростному соскамливанию — пишут в интернетах. Всего за шесть часов с момента запуска организаторы собрали с лохов почти лям баксов и свалили в закат. Я адский хейтер крипты и могу часами рассказывать о том, почему мне не нравится, как человечество обошлось с этой технологией. Новости, вроде той, что выше, как, впрочем, и вполне серьёзные новости про появление вещей вроде NFT вызывают во мне смесь бессилия и истерики. Каждый день читаю что-то подобное, человечество долбанулось. Даже Дуров недавно написал про крипту и словил двадцать тысяч минусов, полностью отключив из-за этого реакции у себя на канале. Подумал о том, что можно оценивать вещь по тому, в каких сценариях и какие люди её используют. Например, хлеб едят в том числе преступники, и он позволяет им не умирать от голода и продолжать творить свои преступления — это плохо. Но хлеб едят и обычные люди, дети, старики, законопослушные. Суммарное добро от существования хлеба на много порядков превышает любое возможное зло от него. Двигаемся по шкале сложности оценки чуть дальше: видеоигры вызывают у детей и подростков зависимость, портят зрение и расшатывают нестабильную детскую психику. Но в то же время миллионам людей они позволяют получать удовольствие, расслабляться, проводить досуг. А многим ещё и зарабатывать. Причем, как на самих играх (киберспорт), так и на их создании. Ещё дальше на шкале будет оружие и, например, алкоголь. Уже нельзя однозначно сказать, являются ли эти вещи скорее добром или скорее злом. Так вот крипта за ~10 лет активного существования толком не принесла человечеству пользы. Хотя потенциал у технологии был, о децентрализованном свободном от корпораций интернете до сих пор пишут только в теоретических статьях (половина из которых критические). Однако вреда, обмана, мошенничества и просто пустого слива денег в унитаз очень много: начиная от заработков спекулянтов и заканчивая очередным криптостартапом, получающим миллионные инвестиции за страничку в Notion. Отдельные люди на этом наварились (чаще всего не сделав совершенно ничего полезного), и это только добавляет очков в минус, примерно по той же причине, по которой нельзя считать добром обогащение владельцев Кэшбери. Кажется, никакую технологию люди не умудрились использовать настолько бездарно, как крипту. Даже от ядерного оружия и автомобилей, при их очевидной деструктивности, есть польза. Есть ощущение, что это связано именно с периодом развития людской расы, а не конкретно с технологией: просто у нас уже очень много всего, и мы зажрались, бесимся с жиру. Если будет появляться что-то новое прорывное, судьба у него будет незавидная: не удивлюсь, если сильный ИИ посадят придумывать, как показать народу больше рекламы, а не как искать лекарство от рака. #web

Hashtags

Резултати

Намерени 1 подобни публикации

Търсене: #bitdance

当前筛选 #bitdance清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #9534 · 17.02.2026 г., 09:02

🌟BitDance: авторегрессионная генерация изображений с бинарными токенами. Генеративные модели делятся на 2 лагеря: диффузионные и авторегрессионные. Вторые концептуально ближе к LLM - генерируют изображение токен за токеном, как текст. Проблема в том, что это очень медленно, а качество проигрывает диффузии. BitDance - экспериментальная 14B AR-модель, которая пытается решить оба этих вопроса разом. Этим проектом группа китайских рисёчеров показала, что правильный бинарный токенизатор + diffusion head + параллельный патчинг закрывает большинство претензий. Они локализовали 3 проблемы дискретных AR-моделей и закрыли каждую отдельным решением. 🟡Плохая реконструкция токенизатора Вместо VQ-кодбука тут используется бинарный токенизатор на основе квантования с групповым разбиением каналов. Словарь вырастает до 2²⁵⁶ (для сравнения: у Cosmos - 65536), при этом модель держит PSNR 25.29 против 24.81 у непрерывного DC-AE, то есть бинарные токены реконструируют изображение лучше, чем VAE у SANA. 🟡Нестабильный сэмплинг А как вообще выбирать из словаря в 2²⁵⁶ вариантов? Обучить классификатор на все возможные токены тут не вариант: такой слой не поместится ни в какую память. В качестве решения - прикрутили diffusion head, которая моделирует биты на непрерывном гиперкубе. То есть, модель предсказывает структуру битов через velocity-matching, что и позволяет сэмплить из гигантского пространства состояний. 🟡Скорость AR генерирует по одному токену за шаг. BitDance за один шаг выдает сразу 64 токена (или 16), при этом модель понимает, как они связаны между собой внутри этого блока. Громко заявленный результат: 30x ускорение относительно next-token AR при сопоставимом качестве. об этом в конце 🟡Тесты На мелкой версии ImageNet BitDance-H достигает FID 1.24 (лучший результат среди AR-моделей, наравне с xAR-H). На DPG-Bench (text-to-image) полноценная BitDance набирает 88.28 - это выше FLUX.1-Dev, SD3, Janus-Pro, но уступает Seedream 3.0 и Qwen-Image. В релизе 2 версии 14B модели, с предикшеном на 16 и 64 токена и макс. разрешением 1Мpx. Остается вопрос: насколько бинарный токенизатор + diffusion head добавляет латентности на каждом шаге, даже если самих шагов стало меньше из-за патчинга. 30x по скорости - это сравнение не с диффузионными моделями, которые уже умеют генерировать за 4–8 шагов. 14B - это не про "взял и запустил". Есть конечно версии на ImageNet с разрешением 256х256 для воспроизведения эксперимента, но не за этим мы сюда пришли. 📌Лицензирование: Apache 2.0 License. 🟡Страница проекта 🟡Arxiv 🟡Модель 🟡Demo 🖥GitHub @ai_machinelearning_big_data #AI#ML#AR#T2I#BitDance