Собираю тут дрон в путешествие, примерил крепление для GoPro. На простых FPV-дронах присутствие GoPro — обычное явление. Курсовая камера обычно не слишком высокого качества, и для окончательного видео ведут запись отдельно. Но зачем это на DJI, у которого и так камера с хорошими характеристиками?
Всё дело в стабилизации. С одной стороны, у GoPro на борту алгоритм Hypersmooth, который неплох, но не превосходит бортовой же алгоритм, встроенный в DJI. По крайней мере, разница совершенно точно не стоит добавочных 200 грамм веса и добавочных денег на покупку GoPro.
Но всё меняется, когда речь заходит о постобработке. GoPro пишет данные с гироскопа, синхронизированные с видеорядом, то есть угол наклона и другие движения можно вычислять не с помощью анализа изображения, а просто знать действительные значения в момент съёмки. Это позволило им выпустить программу ReelSteady, которая стабилизирует, как боженька. Ничто даже близко не подобралось к ней. Результат стабилизации невероятно офигенный и на три головы превосходит абсолютно все другие решения на рынке. Из-за этого многие владельцы DJI FPV, как и я, прикручивают на свой дрон GoPro, жертвуя маневренностью и полетным временем (а в случае аварии ещё и дополнительными деньгами).
Очень странно, что компания DJI сама не сделала ничего подобного: гироскоп в системе есть, алгоритм стабилизации известен — да, существует опенсорсная альтернатива ReelSteady под названием GyroFlow, работает ничуть не хуже. Но факт остаётся фактом: стабилизация на основе гиро-данных на световые годы впереди всего остального. Она, конечно, требует изрядных вычислительных ресурсов и не может быть произведена прямо на борту дрона или экшен-камеры. Даже мощный компьютер справляется не в реальном времени. Тем не менее, для получения действительно качественного результата это всё оправдано.
Я пока ни разу не пробовал сам летать с GoPro. Если не убьюсь о первую же скалу в Карелии, вы сможете увидеть результат через пару недель.
#gadgets#drone
#Linux Desktop application that provides live #captioning
FUTO Fellowship program interview; linux captions software
👉 Live Captions github: https://github.com/abb128/LiveCaptions
🔵 Q&A w/ billionaire alt-tech investor/philanthropist Eron Wolf
https://www.youtube.com/watch?v=OJPmbcU-Vzo
🔵 FUTO Fellows program: https://futo.org/fellows/
🔵 FUTO Youtube channel - @futotech
⚠️ Google's breaches of privacy have gone TOO FAR!
https://www.youtube.com/watch?v=_vWAF13KigI
#speech#recognition#stt#voice
✍️ JoyCaption Ultimate α2 (2024-09-26) ● Генератор описаний и тегов для изображений с режимом пакетной обработки ● RU ● by NerualDreming & Slait
Ссылка на оригинальный GitHub:https://github.com/fpgaminer/joycaption
Репакеры: #NerualDreming, #Slait
Дата обновления модели: 26 сентября 2024
Версия: α2
Категории:#captioning, #AIvision, #img2txt
Платформа:#Windows
Язык: RU
Место на диске: 20 ГБ
Системные требования: NVIDIA GPU 12gb VRAM
Совместимость:#Nvidia
🖥Описание софта:
JoyCaption — инструмент для генерации подробных описаний изображений в различных стилях и форматах. Незаменим для создания описаний изображений при подготовке тренировочных датасетов. Полезен для получения промптов из любых изображений. Адекватно работает с NSFW-концепциями и тегами.
В этой русифицированной модифицированной сборке добавлена поддержка пакетной обработки файлов, сохранение обработанных изображений в директорию проекта, перевод интерфейса и многое другое для удобства работы. Всё работает локально, используя квантованную модель nf4 для экономии ресурсов и увеличения скорости обработки.
😬 Основные возможности JoyCaption α2:
🟣9 режимов генерации (описание, SD-промпты, MidJourney, booru-теги, соцсети и др.)
🟣Расширенные инструкции: имя персонажа, свет, композиция, глубина, качество
🟣Формальный и неформальный стиль
🟣Выбор длины описания
🟣Поддержка пользовательских промптов
🟣Сохранение промптов и изображений в отдельную папку
🟣Возможность визуально проверить и исправить вручную неудачные промпты в пакетном режиме, с повторным сохранением по одному, или всех сразу
🟣Переведённый UI и простой запуск
💿Установка и запуск:
⁍ Скачайте 7z архив JoyCaption с установщиком или с окружением
⁍ Разархивируйте с помощью 7-Zip
⁍ Распакуйте архив в удобное место (без кириллицы и пробелов в пути)
⁍ Запустите файл installer.bat если скачали установщик
⁍ Запустите файл start_joy_caption.bat если скачали версию с готовым окружением
⁍ После загрузки моделей интерфейс откроется в браузере
➡️ Скачать архиватор 7z
➡️joy_caption_ultimate_portable_installer.7z — установщик, всё скачает сам
➡️joy_caption_ultimate_portable_environment.7z — готовое окружение, скачиваются только модели
💬Обсудить в чате | ⭐️Поддержать канал
👾НЕЙРО-СОФТ — Делаем нейросети доступнее.
✍️ SuperCaption Qwen3-VL ● Ультимативный генератор описаний ● Portable by Nerual Dreming & Slait
Ссылка на оригинальный GitHub: https://github.com/timoncool/SuperCaption_Qwen3-VL
Репакеры:#NerualDreming, #Slait
Дата обновления: 26 ноября 2025
Версия: 1.0
Категории:#captioning, #img2txt, #AIvision, #video2txt, #OCR, #dataset
Платформа:#Windows
Язык: RU, EN, CN
Место на диске: ~15 ГБ (зависит от модели)
Системные требования: NVIDIA GPU (минимум 6 ГБ VRAM для 2B модели, рекомендуется 12+ ГБ для 8B+)
Совместимость:#Nvidia
🖥Описание софта
SuperCaption Qwen3-VL — это мощнейший комбайн для анализа визуального контента. В его основе лежит модель Qwen3-VL, которая "видит" мир лучше многих конкурентов.
Главная фича — использование Abliterated моделей, у которых отключена цензура. Это значит, что софт опишет абсолютно всё, что вы ему покажете, без морализаторства и отказов.
Идеальный инструмент для дата-сайентистов, контент-мейкеров и всех, кому нужно превратить гигабайты картинок и видео в структурированный текст.
😬Основные возможности SuperCaption Qwen3-VL
Работа с изображениями (50+ режимов):
🟣Генерация промптов: Создает готовые промпты для Stable Diffusion и MidJourney, теги в стиле Booru.
🟣Маркетинг и SEO: Пишет продающие описания товаров, SEO-тексты (до 160 символов), посты для соцсетей.
🟣 Продвинутый OCR: Распознает текст на 20+ языках, конвертирует таблицы с картинок сразу в HTML-код, извлекает данные в JSON.
🟣Сравнение и анализ: Режимы "До/После", сравнение товаров, контроль качества (поиск дефектов), анализ временных рядов.
🟣Object Detection: Находит объекты и выдает их координаты (bbox) в JSON или рисует рамки прямо на фото.
Интеллектуальный анализ:
🟣Thinking Mode: Режим "рассуждений" для сложных задач — модель сначала думает, потом отвечает.
🟣Решение задач: Пошаговое решение математики, физики, разбор учебных заданий.
🟣Аналитика: Читает графики, диаграммы, технические чертежи и медицинские снимки.
Видео-аналитика:
🟣Таймлайны: Создает хронологию событий с таймкодами.
🟣Саммари: Делает краткую выжимку содержания длинных видео.
🟣Анализ монтажа: Оценивает склейки, переходы, темп и операторскую работу.
🟣Поиск действий: Находит конкретные моменты (например, "когда человек начал бежать").
Прочее:
🟣Пакетная обработка: Закидываете папку с тысячей файлов -> идете пить кофе -> получаете TXT/JSON/CSV файлы для каждого.
🟣Гибкость: Полная поддержка кастомных промптов на русском языке.
💿Установка и запуск
⁍ Скачайте архив SuperCaption_Qwen3-VL.
⁍ Распакуйте в удобное место (путь без кириллицы!).
⁍ Запустите install.bat и выберите свою видеокарту.
⁍ Нажмите Enter и дождитесь окончания установки.
⁍ Запустите run_with_update.bat для старта.
⁍ Интерфейс откроется в браузере (http://127.0.0.1:7860).
➡️Скачать SuperCaption с GitHub — исходный код
➡️Скачать Portable установщик — скачает все что нужно
➡️Скачать Portable архив с окружением — Окружение под Win 11 и RTX 4090
💬Обсудить в нашем чате
👾НЕЙРО-СОФТ - делаем нейросети доступнее