@libreware · Post #1085 · 04.05.2022 г., 09:32
Wenet Automatic #Speech#Recognition toolkit. https://github.com/wenet-e2e/wenet https://wenet.org.cn/wenet/
Hashtags
TGINSIGHT SIMILAR POSTS
Изходен канал @clockstackwheels · Post #512 · 21.08
В одном чате вспомнили недавно Flash. С этой технологией связана значительная часть моей жизни и становления, как специалиста: с неё я начал учить программирование и на ней же заработал не только первые серьёзные деньги, но и вообще одну из крупнейших в своей жизни сумм за единицу времени (тогда был экспоненциальный рост игр для соцсетей, мне тоже удалось чуть-чуть вписаться). Никогда не прощу Apple убийство флэша. Этот софт опережал своё время: художники рисовали на нём полноценные мультики и делали сложные анимации, а программисты создавали демосцены и игры, богатые графикой и даже, при желании, с физическим и 3D-движком. В старших классах я на флэше делал работу для экзамена по географии. Казалось, там можно вообще всё. У флэша почти не было проблем совместимости. Да, ему требовался Flash Player, но зато во всех браузерах флэшки отрисовывались и работали одинаково. Не нужно было думать о том, что какой-то очередной браузер из-за мудачества его разработчиков не поддерживает очередную команду, тег, свойство или API. Возможности по графике, интерактиву и медиа в браузере только недавно еле еле догнали то, что мог флэш в 2000-х. А язык программирования ActionScript 3.0 и сейчас на световые годы впереди JavaScript'а. Да, были недостатки. Проприетарность технологии тормозила и развитие и активность комьюнити. Никакой резиновой вёрстки — только скалярное пространство с числовыми координатами под заданное соотношение сторон. Да, в какой-то момент появился MXML, но это совсем отдельная ветка. Хотя, сейчас вон тоже сайты под десктопы и мобилы по суди два раза верстают. Я нашел этот скриншот в статье 2011 года, которая заканчивается так: «...что касается интернет-приложений и разработки игр, тут Flash на долгие годы останется лучшим выбором для разработчика». Уже через год после этой статьи Adobe объявила о будущем скором прекращении поддержки технологии. Впрочем, некоторые современные инструменты, такие, как Unity, позаимствовали очень многое у Flash, так что можно сказать, он переродился. #dev#web
Търсене: #recognition
@libreware · Post #1085 · 04.05.2022 г., 09:32
Wenet Automatic #Speech#Recognition toolkit. https://github.com/wenet-e2e/wenet https://wenet.org.cn/wenet/
Hashtags
@libreware · Post #1084 · 04.05.2022 г., 09:32
Vosk Speech Recognition Toolkit Vosk is an offline open source #speech#recognition toolkit. It enables speech recognition for 20+ languages and dialects - English, Indian English, German, French, Spanish, Portuguese, Chinese, Russian, Turkish, Vietnamese, Italian, Dutch, Catalan, Arabic, Greek, Farsi, Filipino, Ukrainian, Kazakh, Swedish, Japanese, Esperanto, Hindi, Czech. More to come. Vosk models are small (50 Mb) but provide continuous large vocabulary transcription, zero-latency response with streaming API, reconfigurable vocabulary and speaker identification. Speech recognition bindings implemented for various programming languages like Python, Java, Node.JS, C#, C++ and others. Vosk supplies speech recognition for chatbots, smart home appliances, virtual assistants. It can also create subtitles for movies, transcription for lectures and interviews. Vosk scales from small devices like Raspberry Pi or Android smartphone to big clusters. https://t.me/speech_recognition https://alphacephei.com/vosk https://github.com/alphacep/vosk-api
Hashtags
@libreware · Post #1021 · 09.01.2022 г., 14:56
SongRec An open-source Shazam client for Linux, written in Rust. Features: • Recognize audio from an audio file. • Recognize audio from the microphone. • Usage from both GUI and command line. • Provide an history of the recognized songs. • Continuous song detection. • Ability to recognize songs from your speakers rather than your microphone. Download: https://github.com/marin-m/SongRec#installation https://github.com/marin-m/SongRec @foss_desktop #music#shazam#recognition
Hashtags
@libreware · Post #1192 · 06.10.2023 г., 11:18
#Linux Desktop application that provides live #captioning FUTO Fellowship program interview; linux captions software 👉 Live Captions github: https://github.com/abb128/LiveCaptions 🔵 Q&A w/ billionaire alt-tech investor/philanthropist Eron Wolf https://www.youtube.com/watch?v=OJPmbcU-Vzo 🔵 FUTO Fellows program: https://futo.org/fellows/ 🔵 FUTO Youtube channel - @futotech ⚠️ Google's breaches of privacy have gone TOO FAR! https://www.youtube.com/watch?v=_vWAF13KigI #speech#recognition#stt#voice
@djangoproject · Post #448 · 18.09.2017 г., 11:30
https://medium.com/@GalarnykMichael/logistic-regression-using-python-sklearn-numpy-mnist-handwriting-recognition-matplotlib-a6b31e2b166a Logistic Regression using Python (#Sklearn, #NumPy, #MNIST, Handwriting #Recognition, #Matplotlib) #machine_learning.
@libreware · Post #1114 · 09.03.2023 г., 22:58
https://writeout.ai #Transcribe and #translate any #audio file. 100% free to use. This website with source code available (it can be hosted locally) allows you to upload any audio file and receive a transcription and/or text translation. It uses OpenAI's Whisper API on the back end. Source on GitHub: https://github.com/beyondcode/writeout.ai #writeout#ai#speech#recognition