TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #11 · 15.04

Новый универсальный дрон DJI Air 2S Пожалуй, я буду разбавлять длинные статьи небольшими заметками из мира технологий, а то канал ощущается тяжеловесным. Но, чтобы не быть бестолковым агрегатором новостей, буду дополнять собственным мнением и/или опытом, связанным с темой. Компания DJI только что выпустила новый квадрокоптер — DJI Air 2S. Складное и достаточно компактное устройство весом 600г, является своеобразным гибридом линеек Mavic Mini и Mavic Air. Кстати, обратите внимание на отсутствие слова Mavic в названии. Хотя на офсайте дрон находится в разделе Mavic, но теперь это просто DJI Air, что намекает на полностью отдельную линейку. Из важных особенностей: дюймовый сенсор, который по заявлению производителя может чисто снимать даже в темноте. По личному опыту могу сказать, что в темноте дроны отрабатывают лучше, чем от них ожидаешь, приложу ниже свой снимок Петропавловки с DJI Mavic Air первого поколения. Ещё формально заявлен 8-кратный зум, но это ерунда, потому что он цифровой — тот же эффект получится, если растягивать картинку в видеоредакторе. И второй важный момент — акцент на автоматизацию. В предыдущих моделях тоже были полуавтоматические режимы — дрон облетает вокруг тебя или, например, сам подлетает в точку над тобой и начинает подниматься, смотря вниз. Я почти никогда этими режимами не пользовался, потому что вручную всегда снимешь лучше, если уметь. Но это показывает характерную тенденцию — способность быстро получать сгенерированный контент для условных соцсетей. В своё время телефоны вытеснили с потребительского рынка большие фотокамеры не только из-за того, что телефон у каждого с собой, но и из-за простоты получения результата, который годится для демонстрации широким массам. В отдельной камере ты можешь долго возиться с настройками и фотошопом, а затем получить крутой результат. В телефоне ты можешь нажать одну кнопку и получить сносный результат, который отправишь в Инстаграм. С учётом того, что время жизни контента в интернете сокращается, идёт переход на форматы вроде Историй и коротких роликов — тенденция очевидна. Здесь добавили режимы, благодаря которым дрон сам летает вокруг тебя несколько минут в разных позах, а затем сам же склеивает из этого типа кинематографичное видео. Это гораздо хуже, чем снимать самому, если ты умеешь, но гораздо лучше, чем могут (и хотят!) делать 90% людей. Чтобы внедрить эту функцию, DJI якобы улучшили определение препятствий и режим слежения за движущимся объектом. По опыту могу сказать, что и то и другое — полный отстой, даже у лучшей в мире дроно-компании. Хвалёное определение препятствий полностью бессильно перед ветками и проводами — то есть тогда, когда оно действительно нужно. Потому что стену и ствол дерева я без проблем замечу сам. Что касается ActiveTrack (слежение за целью), то, опять же, оно работает нормально только при полном отсутствии препятствий. Вот как в рекламных роликах по ссылке, которую я привёл — если ты едешь по чистому полю или берегу моря. В реальных условиях даже небольшой ряд кустов вокруг дороги делает функцию неюзабельной. И вторая проблема — общая низкая скорость этих дронов. Здесь заявляют около 70 км/ч в спортивном режиме в безветрие. По факту получается 40-50 км/ч, даже для слежения за велосипедом скорости маловато, а слежение за автомобилем или мотоциклом адекватно организовать не получится. Тем не менее, при всех недостатках новая модель выглядит, как крутой универсальный дрон на все случаи жизни, и в особенности для путешествий (если вы не боитесь, что в аэропорту заставят его выкидывать). Обычная версия стоит $999, а расширенный комплект $1299, что по меркам качественных дронов не дорого. #gadgets#tech

Резултати

Намерени 1 подобни публикации

Търсене: #bfl

当前筛选 #bfl清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #9625 · 05.03.2026 г., 13:26

🌟Self-Flow: обучение диффузионных моделей без внешних энкодеров от Black Forest Labs. Black Forest Labs и MIT решили проблему, с которой сталкиваются диффузионные и flow-модели: чтобы генерировать качественные картинки, им нужны сильные семантические представления. Обычно их берут снаружи - выравнивают внутренние признаки модели с признаками энкодера вроде DINOv2. Метод работает, но есть нюанс. Чем сильнее энкодер, тем хуже результат: в экспериментах замена DINOv2-B на более мощный DINOv3-H+ стойко ухудшала FID. Модель привязывалась к фиксированным внешним представлениям и переставала масштабироваться. На видео и аудио выравнивание с энкодерами V-JEPA2 и MERT вообще давало результат хуже ванильного flow matching. 🟡Self-Flow предлагает механизм Dual-Timestep Scheduling В стандартном flow matching все токены нойзятся одинаково, поэтому модель решает задачу локально и не учится строить глобальные связи. Self-Flow сэмплирует 2 разных уровня шума и случайно назначает их разным токенам (часть входа зашумлена сильнее, часть чище). Это создает асимметрию: чтобы восстановить сильно зашумленные токены, модель вынуждена опираться на чистые и строить глобальный контекст. Поверх этого работает самообучение по принципу дистилляции. Обучаются одновременно 2 копии модели: модель-ученик видит смешанный зашумленный вход, модель-учитель - более чистую версию (EMA-копия с экспоненциальным скользящим средним). Ученик учится предсказывать признаки учителя из зашумленного входа, и это вынуждает его развивать сильные семантические представления без какого-либо внешнего энкодера. 🟡Результаты тестов 🟢На ImageNet 256×256 Self-Flow показал FID 5.70 против 5.89 у REPA; Это, кстати, первый случай, когда self-supervised метод превзошел внешнее выравнивание на этом бенче 🟢На text-to-image: FID 3.61 против 3.92 у REPA; 🟢По видео: FVD 47.81 против 49.75 у REPA; 🟢По аудио: лучшие FAD-оценки среди всех вариантов. При этом на масштабировании (с 290M до 1B) разрыв с REPA увеличивается: модель Self-Flow на 625M параметров обходит REPA на 1B. Метод универсален для модальностей - он работает одинаково на картинках, видео и аудио, что намекает на применение для мультимодального обучения. В репозитории проекта есть код инференса на основе SiT-XL/2 с per-token timestep conditioning, чекпоинт на основе ImageNet 256×256 и скрипты для генерации сэмплов под FID-оценку через ADM evaluation suite. Поддерживаются режимы SDE и ODE, мульти-GPU через torchrun. 🟡Статья 🟡Техотчет 🖥GitHub @ai_machinelearning_big_data #AI#ML#Multimodal#Framework#BFL