TGTGInsighttelegram intelligenceLIVE / telegram public index
← GitHub Trends

TGINSIGHT SIMILAR POSTS

Find similar content

Source channel @githubtrending · Post #15034 · Aug 7

#javascript#antd#music#music_player#nodejs#react#react_router#redux#webapp#webpack Copper Bell is a free website app focused on listening to music. It offers many songs and has a simple, clean design that makes it easy to find and play your favorite music. You can search for songs, make playlists, read scrolling lyrics, save songs, and create your own song lists. It does not have live broadcasts, social features, or ads, so there are no distractions and you get a pure music experience. You can use it on any modern web browser without installing anything. It works on many devices, including tablets. This way, you can enjoy music, manage your songs, and discover new tunes easily anytime and anywhere. https://github.com/enzeberg/tonzhon-music

Results

2 similar posts found

Search: #speechrecognition

当前筛选 #speechrecognition清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8484 · 09/09/2025, 12:01 PM

🎙️ Qwen3-ASR — универсальная модель распознавания речи! 🟢Поддержка EN/CN + ещё 9 языков: ar, de, en, es, fr, it, ja, ko, pt, ru, zh 🟢 Авто-определение языка 🟢 Модель умеет распознавать речь даже в сложных условиях — когда человек поёт, читает рэп или говорит под фоновую музыку. — WER <8% (ошибки меньше 8 слов на каждые 100) 🟢 Работает даже в шуме, низком качестве и на расстоянии 🟢 В модель можно добавить свои слова/термины/имена и фразы, и она будет их правильно распознавать ▪API:https://bailian.console.alibabacloud.com/?tab=doc#/doc/?type=model&url=2979031 ▪ModelScope Demo: https://modelscope.cn/studios/Qwen/Qwen3-ASR-Demo ▪Hugging Face Demo: https://huggingface.co/spaces/Qwen/Qwen3-ASR-Demo ▪Blog:https://qwen.ai/blog?id=41e4c0f6175f9b004a03a07e42343eaaf48329e7&from=research.latest-advancements-list @ai_machinelearning_big_data #ASR#SpeechRecognition#Qwen3#AI#MachineLearning#DeepLearning#VoiceAI

Machinelearning

@ai_machinelearning_big_data · Post #8296 · 08/18/2025, 11:11 AM

🎙️NVIDIA выпустили Canary-1B v2 — открытую модель для распознавания и перевода речи, которая работает с 25 европейскими языками. Что она умеет: - 📝 Точное ASR (распознавание речи) и AST (перевод речи) между английским и 24 другими языками. - Автоматическая пунктуация, капитализация и точные таймстампы до слова. - Поддержка русского, французского, немецкого, испанского и многих других языков. Чем интересна - До 10× быстрее инференс, чем у моделей в 3 раза больше. - Уже показывает state-of-the-art точность среди открытых моделей на Hugging Face. - Лицензия CC-BY-4.0 — можно свободно использовать в проектах. Под капотом: - Архитектура: FastConformer-энкодер + Transformer-декодер (~978M параметров). - Форматы: .wav и .flac, моно 16 кГц. - Легко интегрируется через NVIDIA NeMo или прямо с Hugging Face. Где пригодится: 🟢 голосовые ассистенты 🟢 субтитры и перевод видео 🟢 чат-боты с речевым вводом 🟢 real-time анализ речи Всего ~978M параметров → легче, быстрее и дешевле в использовании, чем большие модели конкурентов. 🟠Попробовать можно здесь: https://huggingface.co/nvidia/canary-1b-v2 🟠SET: https://huggingface.co/datasets/nvidia/Granary 🟠PARAKEET: https://huggingface.co/nvidia/parakeet-tdt-0.6b-v3 @ai_machinelearning_big_data #AI#NVIDIA#SpeechRecognition#ASR#AST#Multilingual#MachineLearning#DeepLearning