TGTGInsighttelegram intelligenceLIVE / telegram public index
← GitHub Trends

TGINSIGHT SIMILAR POSTS

Find similar content

Source channel @githubtrending · Post #14949 · Jul 12

#jupyter_notebook#darknet#pytorch#scaled_yolov4#yolor#yolov3#yolov4#yolov7 YOLOv7 is a powerful tool for detecting objects in images and videos. It is fast, accurate, and can work well on devices with limited power, making it useful for real-time applications like self-driving cars and surveillance systems. YOLOv7 uses advanced techniques like Feature Pyramid Networks to detect objects of different sizes and can handle complex scenes with overlapping objects. This makes it beneficial for users who need quick and precise object detection in various environments. https://github.com/WongKinYiu/yolov7

Results

1 similar post found

Search: #diarization

当前筛选 #diarization清除筛选

🗣 VibeVoice ASR ● Распознавание речи и диаризация ● RU ● Portable by Nerual Dreming Ссылка на оригинальный GitHub:https://github.com/microsoft/VibeVoice Ссылка на репозиторий репакера:https://github.com/timoncool/VibeVoice_ASR_portable_ru Репакер:#nerual_dreming Дата обновления: 3 февраля 2026 Категории:#stt, #ASR, #diarization, #AIaudio Платформа:#Windows Язык: RU Системные требования: NVIDIA GPU с поддержкой CUDA от 8 ГБ VRAM для полной версии, меньше для квантованной Совместимость:#Nvidia 🖥Описание софта VibeVoice ASR — новейшая модель от Microsoft для транскрибации, диаризации (разделения по спикерам) и простановки таймкодов за один проход. Главная фишка — обработка до 60 минут аудио целиком, без нарезки на куски, что позволяет модели «понимать» контекст всей беседы. Особенности портативной версии: В сборку включены две модели: полная (оригинал) и квантованная (от scerz). Реализована поддержка эмуляции 4-bit квантизации для полной модели — это позволяет запускать тяжелую оригинальную версию даже на картах с небольшим объемом памяти без потери качества. Также добавлена нативная поддержка видеофайлов и парсер текста с выбором спикеров для показа. 😬Основные возможности VibeVoice ASR: 🟣Две модели на борту: Выбор между оригинальной Full версией и оптимизированной Quantized (scerz). 🟣Эмуляция квантизации: Уникальная фича сборки — возможность запуска полной модели в режиме 4-bit (bitsandbytes) для экономии VRAM. 🟣Всеядность: Поддержка не только аудио, но и видео (MP4, MKV, AVI, MOV) — звук извлекается автоматически через FFmpeg. 🟣Умная диаризация: Точное определение «Кто, Когда и Что сказал» (Who, When, What). 🟣Длинный контекст: Обработка часовых записей без потери смысла и путаницы в спикерах. 🟣Удобство: Веб-интерфейс на русском языке 🟣Парсер текста: позволяет скрыть или показать временные метки, спикеров, дескрипторы 💿Установка и запуск ⁍ Скачайте архив с установщиком или окружением. ⁍ Распакуйте в папку без кириллицы в пути. ⁍ Запустите install.bat для установки библиотек (для установщика). ⁍ Запустите run.bat для старта веб-интерфейса. ⁍ Модели скачаются при первом запуске ➡️Скачать VibeVoice ASR Portable installer— установщик, сам все скачает ➡️Скачать VibeVoice ASR Portable env — готовое окружение для RTX 4090 и win11 💬Обсудить в нашем чате 👾НЕЙРО-СОФТ - делаем нейросети доступнее