@libreware · Post #1085 · 04.05.2022 г., 09:32
Wenet Automatic #Speech#Recognition toolkit. https://github.com/wenet-e2e/wenet https://wenet.org.cn/wenet/
Hashtags
TGINSIGHT SIMILAR POSTS
Изходен канал @clockstackwheels · Post #711 · 24.12
Графика в видеоиграх выглядит, как мультфильм, и отличается от графики в реальном мире либо на фотографии. Причина этого такая: чтобы нарисовать картинку, нам нужно знать, в каких местах какое количество света и цвета. Но свет в реальности — очень сложная фигня, и по факту он отражается от всего подряд, в том числе от незеркальных и неметаллических поверхностей. Ярким летним днём у вас в квартире светло даже там, куда не доходят напрямую солнечные лучи через окна. Трёхмерные мультики и компьютерные эффекты в кинофильмах мы уже научились делать похожими на фотографию, потому что там у нас на каждый кадр есть сколько угодно времени: можно очень подробно обсчитать сцену и определить, как и где расположен свет. Пусть вывод одного кадра займёт час процессорного времени (а рендерят мультики и фильмы на фермах), не страшно, зато красиво выходит. С играми всё хуже: получать картинку нужно сразу. В игре компьютер не знает заранее, в какую сторону я повернусь и на что посмотрю, поэтому нужно уметь вычислять внешний вид изображения на основе геометрии трёхмерной сцены. И делать это для комфортной игры как минимум 60 раз в секунду. Поэтому такое вычисление производят очень приблизительно, чтобы было быстро. Это смотрится неплохо, и мы способны узнать в игре человека, оружие, машину, но всё равно любым невооружённым глазом такое легко отличить от реальности. С развитием технологий и увеличением мощности видеокарт получил распространение метод трассировки лучей: из "глаз" игрока испускается невидимый луч, рассчитываются его отражения и преломления от всех поверхностей на некоторую глубину, а потом смотрят, попал ли этот луч в источник света. Зная его траекторию, мы можем "вернуть" в виртуальную камеру правильное количество света и правильный цвет. Понятно, что таких лучей должно быть очень много, и вот тут современные видеокарты с их параллельными вычислениями уже начинают неплохо себя показывать. Я попробовал Portal with RTX, его можно бесплатно скачать в Стиме, если у вас есть базовый Portal. Да, игра 15-летней давности, как её ни причёсывай, совсем круто не будет. Тем не менее, специалисты из Nvidia поработали над освещением, и местами очень приятно наблюдать, как картинка начинает выглядеть более правильно с точки зрения реальной физики. Массового внедрения технологии, видимо, не стоит ожидать, пока половина геймеров не обзаведутся топовыми видеокартами. И в целом графика впечатляет меньше, чем демка Матрицы. Но всё равно крайне любопытно. #games
Hashtags
Търсене: #recognition
@libreware · Post #1085 · 04.05.2022 г., 09:32
Wenet Automatic #Speech#Recognition toolkit. https://github.com/wenet-e2e/wenet https://wenet.org.cn/wenet/
Hashtags
@libreware · Post #1084 · 04.05.2022 г., 09:32
Vosk Speech Recognition Toolkit Vosk is an offline open source #speech#recognition toolkit. It enables speech recognition for 20+ languages and dialects - English, Indian English, German, French, Spanish, Portuguese, Chinese, Russian, Turkish, Vietnamese, Italian, Dutch, Catalan, Arabic, Greek, Farsi, Filipino, Ukrainian, Kazakh, Swedish, Japanese, Esperanto, Hindi, Czech. More to come. Vosk models are small (50 Mb) but provide continuous large vocabulary transcription, zero-latency response with streaming API, reconfigurable vocabulary and speaker identification. Speech recognition bindings implemented for various programming languages like Python, Java, Node.JS, C#, C++ and others. Vosk supplies speech recognition for chatbots, smart home appliances, virtual assistants. It can also create subtitles for movies, transcription for lectures and interviews. Vosk scales from small devices like Raspberry Pi or Android smartphone to big clusters. https://t.me/speech_recognition https://alphacephei.com/vosk https://github.com/alphacep/vosk-api
Hashtags
@libreware · Post #1021 · 09.01.2022 г., 14:56
SongRec An open-source Shazam client for Linux, written in Rust. Features: • Recognize audio from an audio file. • Recognize audio from the microphone. • Usage from both GUI and command line. • Provide an history of the recognized songs. • Continuous song detection. • Ability to recognize songs from your speakers rather than your microphone. Download: https://github.com/marin-m/SongRec#installation https://github.com/marin-m/SongRec @foss_desktop #music#shazam#recognition
Hashtags
@libreware · Post #1192 · 06.10.2023 г., 11:18
#Linux Desktop application that provides live #captioning FUTO Fellowship program interview; linux captions software 👉 Live Captions github: https://github.com/abb128/LiveCaptions 🔵 Q&A w/ billionaire alt-tech investor/philanthropist Eron Wolf https://www.youtube.com/watch?v=OJPmbcU-Vzo 🔵 FUTO Fellows program: https://futo.org/fellows/ 🔵 FUTO Youtube channel - @futotech ⚠️ Google's breaches of privacy have gone TOO FAR! https://www.youtube.com/watch?v=_vWAF13KigI #speech#recognition#stt#voice
@djangoproject · Post #448 · 18.09.2017 г., 11:30
https://medium.com/@GalarnykMichael/logistic-regression-using-python-sklearn-numpy-mnist-handwriting-recognition-matplotlib-a6b31e2b166a Logistic Regression using Python (#Sklearn, #NumPy, #MNIST, Handwriting #Recognition, #Matplotlib) #machine_learning.
@libreware · Post #1114 · 09.03.2023 г., 22:58
https://writeout.ai #Transcribe and #translate any #audio file. 100% free to use. This website with source code available (it can be hosted locally) allows you to upload any audio file and receive a transcription and/or text translation. It uses OpenAI's Whisper API on the back end. Source on GitHub: https://github.com/beyondcode/writeout.ai #writeout#ai#speech#recognition