@libreware · Post #1085 · 04.05.2022 г., 09:32
Wenet Automatic #Speech#Recognition toolkit. https://github.com/wenet-e2e/wenet https://wenet.org.cn/wenet/
Hashtags
TGINSIGHT SIMILAR POSTS
Изходен канал @clockstackwheels · Post #230 · 23.02
Есть такое понятие Liminal Space — пространство, являющееся переходным между двумя другими. Как правило это пустой коридор, пустая проходная комната, большой пустой двор и так далее. Такие места вызывают у людей определённые эмоции, поэтому за данным понятием стоит целая визуальная эстетика. Есть сабреддит по теме, и из него данные публикуются в твиттер аккаунт Liminal Spaces, у которого более 800 тысяч подписчиков (по меркам Твиттера это как на ютубе 20 млн). Эстетика сама по себе интересная, но сегодня хочу рассказать вам об игре Superliminal, на которую недавно наткнулся. Она из тех игр, что целиком продают себя своей идеей, и вообще, строятся вокруг неё. Посмотрите на видео ниже, и сразу станет понятно, в чём прикол. Помимо классной идеи не могу не отметить техническую реализацию: мне страшно даже представить, с каким количеством сложностей и краевых случаев столкнулись разработчики. Там дальше по игре вообще такие выверты пространства идут, что авторы Portal нервно курят в сторонке. И да, игра активно использует концепцию Liminal Space. Под конец даже слишком. Хотя местами создаётся ощущение, что ты словил баг, но это так и задумано. И один раз мне пришлось подсмотреть на ютубе, как проходить — оказалось, что был неочевидный для меня способ взаимодействия с предметами, который нигде не презентуется. Возможно, разработчики как раз и ставили перед игроком задачу догадаться, но я не осилил. Тем не менее, очень яркое и запоминающееся видеоигровое впечатление. Рекомендую. #games
Hashtags
Търсене: #recognition
@libreware · Post #1085 · 04.05.2022 г., 09:32
Wenet Automatic #Speech#Recognition toolkit. https://github.com/wenet-e2e/wenet https://wenet.org.cn/wenet/
Hashtags
@libreware · Post #1084 · 04.05.2022 г., 09:32
Vosk Speech Recognition Toolkit Vosk is an offline open source #speech#recognition toolkit. It enables speech recognition for 20+ languages and dialects - English, Indian English, German, French, Spanish, Portuguese, Chinese, Russian, Turkish, Vietnamese, Italian, Dutch, Catalan, Arabic, Greek, Farsi, Filipino, Ukrainian, Kazakh, Swedish, Japanese, Esperanto, Hindi, Czech. More to come. Vosk models are small (50 Mb) but provide continuous large vocabulary transcription, zero-latency response with streaming API, reconfigurable vocabulary and speaker identification. Speech recognition bindings implemented for various programming languages like Python, Java, Node.JS, C#, C++ and others. Vosk supplies speech recognition for chatbots, smart home appliances, virtual assistants. It can also create subtitles for movies, transcription for lectures and interviews. Vosk scales from small devices like Raspberry Pi or Android smartphone to big clusters. https://t.me/speech_recognition https://alphacephei.com/vosk https://github.com/alphacep/vosk-api
Hashtags
@libreware · Post #1021 · 09.01.2022 г., 14:56
SongRec An open-source Shazam client for Linux, written in Rust. Features: • Recognize audio from an audio file. • Recognize audio from the microphone. • Usage from both GUI and command line. • Provide an history of the recognized songs. • Continuous song detection. • Ability to recognize songs from your speakers rather than your microphone. Download: https://github.com/marin-m/SongRec#installation https://github.com/marin-m/SongRec @foss_desktop #music#shazam#recognition
Hashtags
@libreware · Post #1192 · 06.10.2023 г., 11:18
#Linux Desktop application that provides live #captioning FUTO Fellowship program interview; linux captions software 👉 Live Captions github: https://github.com/abb128/LiveCaptions 🔵 Q&A w/ billionaire alt-tech investor/philanthropist Eron Wolf https://www.youtube.com/watch?v=OJPmbcU-Vzo 🔵 FUTO Fellows program: https://futo.org/fellows/ 🔵 FUTO Youtube channel - @futotech ⚠️ Google's breaches of privacy have gone TOO FAR! https://www.youtube.com/watch?v=_vWAF13KigI #speech#recognition#stt#voice
@djangoproject · Post #448 · 18.09.2017 г., 11:30
https://medium.com/@GalarnykMichael/logistic-regression-using-python-sklearn-numpy-mnist-handwriting-recognition-matplotlib-a6b31e2b166a Logistic Regression using Python (#Sklearn, #NumPy, #MNIST, Handwriting #Recognition, #Matplotlib) #machine_learning.
@libreware · Post #1114 · 09.03.2023 г., 22:58
https://writeout.ai #Transcribe and #translate any #audio file. 100% free to use. This website with source code available (it can be hosted locally) allows you to upload any audio file and receive a transcription and/or text translation. It uses OpenAI's Whisper API on the back end. Source on GitHub: https://github.com/beyondcode/writeout.ai #writeout#ai#speech#recognition