TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #583 · 3.10

Пару недель назад в один день презентовали сразу две новые модели экшен-камер от разных производителей: DJI Action 3 и GoPro Hero 11. Технически даже три, потому что у GoPro есть версия Mini, о ней чуть ниже. Вообще говоря, DJI умеют исправлять косяки конкурентов в UI/UX, и в целом владеют этим направлением очень хорошо, на уровне Apple времён первых айфонов. Например, GoPro с первых версий сделали крепление винтом через два ушка, и оно уже приобрело огромную популярность, поэтому все остальные делают такое же. Да и сами GoPro стали заложниками собственного стандарта. Но это крепление плохое и неудобное: с одной стороны оно требует очень много времени на ввинчивание барашка, а с другой стороны подвержено перекосам при резких рывках, если ты затянул не до самой дури. При этом есть полностью отсоединяемый элемент — собственно винт-барашек, который может легко теряться. У DJI проблема решена элегантно и очень мудро: магнит в сочетании с защёлками. Секунда на присоединение, две секунды на отсоединение. Можно прикреплять в сложных условиях, в перчатках, одной рукой итд. Прямо тема для главы учебника по промышленному дизайну или по ТРИЗ. Но во всех аксессуарах давно главенствует неудобное крепление GoPro, поэтому ребятам из DJI пришлось сделать переходник. При этом технически камера от DJI на уровне предыдущего поколения GoPro. И по картинке и по другим параметрам. И, к сожалению, они не удержались от того, чтобы своровать некрасивый асимметричный дизайн. До чего аккуратной и визуально приятной была DJI Action 2 на фоне камер от GoPro, а тут прямо передрали уродство. Это похоже на случай, когда производители Android-смартфонов одно время стали повторять уродскую чёлку от Apple просто ради моды, но, благо, быстро опомнились. Но зато DJI Action 3 сильно дешевле чем даже прошлое поколение от GoPro, вообще, с ценой не стали жадничать. Думаю, GoPro долгое время ощущали себя монополистами, поэтому завышали. Отдельный интерес вызывает версия GoPro 11 Mini. Как большая, но без экранов. Экран на экшен-камере — вещь второстепенная и далеко не всегда нужная. Зато часто имеет значение вес и габариты. Для коптеров, кажется, отличный вариант именно что-то типа Mini. Да, у них есть версия GoPro 10 Bones (без аккумулятора и экрана, облегчённая), но стоит она почему-то неадекватно дорого, а в России дороже, чем точно такая же с экраном и аккумулятором. Короче, на мой взгляд, у DJI виден потенциал, но прямо сейчас пока не дожали. Ещё одно-два поколения, и они обойдут нынешних лидеров. Я надеюсь. #gadgets

Hashtags

Резултати

Намерени 1 подобни публикации

Търсене: #bfl

当前筛选 #bfl清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #9625 · 05.03.2026 г., 13:26

🌟Self-Flow: обучение диффузионных моделей без внешних энкодеров от Black Forest Labs. Black Forest Labs и MIT решили проблему, с которой сталкиваются диффузионные и flow-модели: чтобы генерировать качественные картинки, им нужны сильные семантические представления. Обычно их берут снаружи - выравнивают внутренние признаки модели с признаками энкодера вроде DINOv2. Метод работает, но есть нюанс. Чем сильнее энкодер, тем хуже результат: в экспериментах замена DINOv2-B на более мощный DINOv3-H+ стойко ухудшала FID. Модель привязывалась к фиксированным внешним представлениям и переставала масштабироваться. На видео и аудио выравнивание с энкодерами V-JEPA2 и MERT вообще давало результат хуже ванильного flow matching. 🟡Self-Flow предлагает механизм Dual-Timestep Scheduling В стандартном flow matching все токены нойзятся одинаково, поэтому модель решает задачу локально и не учится строить глобальные связи. Self-Flow сэмплирует 2 разных уровня шума и случайно назначает их разным токенам (часть входа зашумлена сильнее, часть чище). Это создает асимметрию: чтобы восстановить сильно зашумленные токены, модель вынуждена опираться на чистые и строить глобальный контекст. Поверх этого работает самообучение по принципу дистилляции. Обучаются одновременно 2 копии модели: модель-ученик видит смешанный зашумленный вход, модель-учитель - более чистую версию (EMA-копия с экспоненциальным скользящим средним). Ученик учится предсказывать признаки учителя из зашумленного входа, и это вынуждает его развивать сильные семантические представления без какого-либо внешнего энкодера. 🟡Результаты тестов 🟢На ImageNet 256×256 Self-Flow показал FID 5.70 против 5.89 у REPA; Это, кстати, первый случай, когда self-supervised метод превзошел внешнее выравнивание на этом бенче 🟢На text-to-image: FID 3.61 против 3.92 у REPA; 🟢По видео: FVD 47.81 против 49.75 у REPA; 🟢По аудио: лучшие FAD-оценки среди всех вариантов. При этом на масштабировании (с 290M до 1B) разрыв с REPA увеличивается: модель Self-Flow на 625M параметров обходит REPA на 1B. Метод универсален для модальностей - он работает одинаково на картинках, видео и аудио, что намекает на применение для мультимодального обучения. В репозитории проекта есть код инференса на основе SiT-XL/2 с per-token timestep conditioning, чекпоинт на основе ImageNet 256×256 и скрипты для генерации сэмплов под FID-оценку через ADM evaluation suite. Поддерживаются режимы SDE и ODE, мульти-GPU через torchrun. 🟡Статья 🟡Техотчет 🖥GitHub @ai_machinelearning_big_data #AI#ML#Multimodal#Framework#BFL