TGTGInsighttelegram intelligenceLIVE / telegram public index
← GitHub Trends

TGINSIGHT SIMILAR POSTS

Find similar content

Source channel @githubtrending · Post #15495 · Feb 15

#c_lang Moonshine Voice is an open-source toolkit for fast, private on-device speech-to-text that beats Whisper's accuracy and speed (up to 5x faster, 6.65% vs. 7.44% WER) with tiny 26MB-245M models for live apps on phones, Raspberry Pi, and more. It streams results as you speak, supports English/Spanish/Mandarin/etc., and handles transcription/commands easily via simple APIs on Python/iOS/Android. You benefit by building responsive voice apps offline without accounts, keys, or cloud costs—perfect for real-time tools like translators or assistants. https://github.com/moonshine-ai/moonshine

Hashtags

Results

1 similar post found

Search: #wan2

当前筛选 #wan2清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8841 · 10/23/2025, 02:57 PM

🎥 Новинка от ByteDance: модель Video-As-Prompt Wan2.1-14B ByteDance выпустила модель Wan2.1-14B, специализирующуюся на задаче *video-as-prompt*, то есть использование видео или комбинации изображений и текста как входных данных для генерации нового видео. - Работает в режимах «видео → видео» или «изображения/текст → видео». - 14 млрд параметров — высокая детализация, плавная динамика, реалистичные движения. - Использует исходное видео как шаблон стиля и композиции. ⚠️ Что стоит учитывать - Модель требует мощных GPU и большого объёма памяти. - Качество результата зависит от сложности запроса и длины видео. 🟠Github: https://github.com/bytedance/Video-As-Prompt 🟠HF: https://huggingface.co/ByteDance/Video-As-Prompt-Wan2.1-14B @ai_machinelearning_big_data #AI#VideoGeneration#ByteDance#Wan2#HuggingFace