TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #343 · 13.05

Лю Цысинь, «Задача трёх тел». Шутка про то, что из-за санкций фантастику тоже теперь читаю китайскую :) На самом деле, конечно, слышал об авторе давно. Книга принесла ему мировую известность, и вообще, как я понимаю, изрядно продвинула китайскую фантастику на международной арене. Но я добрался только сейчас. Пока прочитал только первую книгу, ещё две на очереди. Это практически целиком «твёрдая» научная фантастика: автор не только старается не противоречить известной физике, но и ожидает от читателя некоторых фундаментальных научных представлений. Вам будет интереснее читать, если вы знаете, что такое реликтовое излучение, релятивистские эффекты, машина Тьюринга и так далее. Вообще, я хочу похвалить автора за смелось: даже просто выпустить в наше время художественную книгу с названием «Задача трёх тел» это уже само по себе круто. А написать её так, чтобы она стала мировым бестселлером — что-то за гранью. Я до сих пор приятно удивлён тому, как много людей на планете нашли её для себя интересной (если, конечно, не предполагать, что изрядная доля читателей просто последовала некоторой моде и хайпу). Сюжет очень захватывающий, и этот эффект достигается интересным образом. Обычно в фантастической литературе мы заранее готовы к любого рода необъяснимым и странным вещам. Но здесь нас сначала достаточно хорошо убеждают в том, что мы имеем дело с нашим реальным настоящим миром, в котором работают обычные законы и не существует законов магических. А после этого начинает происходить необъяснимое и странное. Главное повествование начинается с того, что протагониста — китайского учёного — приглашают к себе военные и рассказывают ему о том, что за последнее время многие учёные совершили самоубийства, и это не похоже на совпадение. Его предупреждают об опасности, на что он реагирует скептически. Но, придя домой вечером... В общем, лучше не рассказывать слишком много, чтобы не испортить впечатление. События нехило держат в напряжении даже несмотря на то, что особенного «экшена» не происходит. При этом в тексте не пропущены «нудные» места: многие физические и математические вещи объясняются весьма подробно. Автор, конечно, не удержался от того, чтобы и у него квантовая запутанность передавала информацию, но за компьютер из людей я готов простить ему многое (и скорее всего вы сейчас совершенно неправильно представили себе, о чём на самом деле речь). Уже купил вторую и третью книги. Напишу короткую заметку по окончании. #fiction

Hashtags

Резултати

Намерени 1 подобни публикации

Търсене: #bfl

当前筛选 #bfl清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #9625 · 05.03.2026 г., 13:26

🌟Self-Flow: обучение диффузионных моделей без внешних энкодеров от Black Forest Labs. Black Forest Labs и MIT решили проблему, с которой сталкиваются диффузионные и flow-модели: чтобы генерировать качественные картинки, им нужны сильные семантические представления. Обычно их берут снаружи - выравнивают внутренние признаки модели с признаками энкодера вроде DINOv2. Метод работает, но есть нюанс. Чем сильнее энкодер, тем хуже результат: в экспериментах замена DINOv2-B на более мощный DINOv3-H+ стойко ухудшала FID. Модель привязывалась к фиксированным внешним представлениям и переставала масштабироваться. На видео и аудио выравнивание с энкодерами V-JEPA2 и MERT вообще давало результат хуже ванильного flow matching. 🟡Self-Flow предлагает механизм Dual-Timestep Scheduling В стандартном flow matching все токены нойзятся одинаково, поэтому модель решает задачу локально и не учится строить глобальные связи. Self-Flow сэмплирует 2 разных уровня шума и случайно назначает их разным токенам (часть входа зашумлена сильнее, часть чище). Это создает асимметрию: чтобы восстановить сильно зашумленные токены, модель вынуждена опираться на чистые и строить глобальный контекст. Поверх этого работает самообучение по принципу дистилляции. Обучаются одновременно 2 копии модели: модель-ученик видит смешанный зашумленный вход, модель-учитель - более чистую версию (EMA-копия с экспоненциальным скользящим средним). Ученик учится предсказывать признаки учителя из зашумленного входа, и это вынуждает его развивать сильные семантические представления без какого-либо внешнего энкодера. 🟡Результаты тестов 🟢На ImageNet 256×256 Self-Flow показал FID 5.70 против 5.89 у REPA; Это, кстати, первый случай, когда self-supervised метод превзошел внешнее выравнивание на этом бенче 🟢На text-to-image: FID 3.61 против 3.92 у REPA; 🟢По видео: FVD 47.81 против 49.75 у REPA; 🟢По аудио: лучшие FAD-оценки среди всех вариантов. При этом на масштабировании (с 290M до 1B) разрыв с REPA увеличивается: модель Self-Flow на 625M параметров обходит REPA на 1B. Метод универсален для модальностей - он работает одинаково на картинках, видео и аудио, что намекает на применение для мультимодального обучения. В репозитории проекта есть код инференса на основе SiT-XL/2 с per-token timestep conditioning, чекпоинт на основе ImageNet 256×256 и скрипты для генерации сэмплов под FID-оценку через ADM evaluation suite. Поддерживаются режимы SDE и ODE, мульти-GPU через torchrun. 🟡Статья 🟡Техотчет 🖥GitHub @ai_machinelearning_big_data #AI#ML#Multimodal#Framework#BFL