@libreware · Post #1085 · 04.05.2022 г., 09:32
Wenet Automatic #Speech#Recognition toolkit. https://github.com/wenet-e2e/wenet https://wenet.org.cn/wenet/
Hashtags
TGINSIGHT SIMILAR POSTS
Изходен канал @clockstackwheels · Post #828 · 1.06
Заблочили Medium. Я им не пользовался, но, кажется, это единственный нетематический текстовый портал в интернете. Задумался о том, почему в англоязычном мире Medium есть, а в рунете никакой аналог не взлетел. Какой-нибудь Teletype был заброшен разработчиками практически сразу после релиза. Дзен — ну вы сами знаете, мусорка. В Телеграме нет дискавери и средств оформления, и более менее заводятся, опять же, строго тематические каналы. Авторские тексты, например, в ВК убиты видосиками и продуктовыми решениями. Кстати, такой же эффект есть на Пикабу: администрация добавила возможность постить короткие вертикальные видео, и теперь вся лента в них. Я был в шоке, когда увидел. Вертикальные видео не просто разбавили тексты, а вытеснили их за считанные дни на площадке, которая всегда была про тексты и картинки. Но почему на русском языке нет живых аналогов Медиума? Вроде считается, что русский народ читающий, но вот что-то не сходится. Вот мои гипотезы: 1. Русские люди читают книги, и поэтому у них в жизни нет недостатка чтения, а от интернета они хотят чего-то развлекательного. 2. Все люди в мире в среднем не читают тексты, но небольшая горстка всё-таки читает. Поскольку Medium был англоязычный, он собирал не только англоязычных читателей, но и вообще читателей со всех стран, и в сумме получилось достаточно, чтобы он жил. 3. Бизнесам не выгодно делать текстовые площадки, потому что тем, кто читает тексты, сложнее что-то впаривать. Medium существует на инвестиции, государственные деньги, на энтузиазме и так далее. #web
Hashtags
Търсене: #recognition
@libreware · Post #1085 · 04.05.2022 г., 09:32
Wenet Automatic #Speech#Recognition toolkit. https://github.com/wenet-e2e/wenet https://wenet.org.cn/wenet/
Hashtags
@libreware · Post #1084 · 04.05.2022 г., 09:32
Vosk Speech Recognition Toolkit Vosk is an offline open source #speech#recognition toolkit. It enables speech recognition for 20+ languages and dialects - English, Indian English, German, French, Spanish, Portuguese, Chinese, Russian, Turkish, Vietnamese, Italian, Dutch, Catalan, Arabic, Greek, Farsi, Filipino, Ukrainian, Kazakh, Swedish, Japanese, Esperanto, Hindi, Czech. More to come. Vosk models are small (50 Mb) but provide continuous large vocabulary transcription, zero-latency response with streaming API, reconfigurable vocabulary and speaker identification. Speech recognition bindings implemented for various programming languages like Python, Java, Node.JS, C#, C++ and others. Vosk supplies speech recognition for chatbots, smart home appliances, virtual assistants. It can also create subtitles for movies, transcription for lectures and interviews. Vosk scales from small devices like Raspberry Pi or Android smartphone to big clusters. https://t.me/speech_recognition https://alphacephei.com/vosk https://github.com/alphacep/vosk-api
Hashtags
@libreware · Post #1021 · 09.01.2022 г., 14:56
SongRec An open-source Shazam client for Linux, written in Rust. Features: • Recognize audio from an audio file. • Recognize audio from the microphone. • Usage from both GUI and command line. • Provide an history of the recognized songs. • Continuous song detection. • Ability to recognize songs from your speakers rather than your microphone. Download: https://github.com/marin-m/SongRec#installation https://github.com/marin-m/SongRec @foss_desktop #music#shazam#recognition
Hashtags
@libreware · Post #1192 · 06.10.2023 г., 11:18
#Linux Desktop application that provides live #captioning FUTO Fellowship program interview; linux captions software 👉 Live Captions github: https://github.com/abb128/LiveCaptions 🔵 Q&A w/ billionaire alt-tech investor/philanthropist Eron Wolf https://www.youtube.com/watch?v=OJPmbcU-Vzo 🔵 FUTO Fellows program: https://futo.org/fellows/ 🔵 FUTO Youtube channel - @futotech ⚠️ Google's breaches of privacy have gone TOO FAR! https://www.youtube.com/watch?v=_vWAF13KigI #speech#recognition#stt#voice
@djangoproject · Post #448 · 18.09.2017 г., 11:30
https://medium.com/@GalarnykMichael/logistic-regression-using-python-sklearn-numpy-mnist-handwriting-recognition-matplotlib-a6b31e2b166a Logistic Regression using Python (#Sklearn, #NumPy, #MNIST, Handwriting #Recognition, #Matplotlib) #machine_learning.
@libreware · Post #1114 · 09.03.2023 г., 22:58
https://writeout.ai #Transcribe and #translate any #audio file. 100% free to use. This website with source code available (it can be hosted locally) allows you to upload any audio file and receive a transcription and/or text translation. It uses OpenAI's Whisper API on the back end. Source on GitHub: https://github.com/beyondcode/writeout.ai #writeout#ai#speech#recognition