@libreware · Post #1085 · 04.05.2022 г., 09:32
Wenet Automatic #Speech#Recognition toolkit. https://github.com/wenet-e2e/wenet https://wenet.org.cn/wenet/
Hashtags
TGINSIGHT SIMILAR POSTS
Изходен канал @clockstackwheels · Post #161 · 15.01
Зимой я выиграл в конкурсе Сбера телевизор Huawei Vision S 55". Недавно его доставили, поделюсь впечатлениями. Я хорошо отношусь к компании Huawei. На мой взгляд, они делают лучшие в мире мобильные камеры. И идеологически их ссору с гуглом я считаю скорее правильной и полезной для рынка. Но конечному потребителю пока что становится хуже. Телевизор Vision S это на самом деле не телевизор, а большой монитор. У него нет АЦП и разъёма для подключения антенны. Это мне глубоко импонирует: эфирное телевидение должно умереть, и чем быстрее, тем лучше. Радует, что на рынке появляются такие решения. Первый шаг к телефону без функции звонков :) Здесь своя операционная система HarmonyOS, на ней предустановленные программы и сервис Салют (умные голосовые помощники и соответствующая экосистема от Сбера). Само устройство лёгкое для своих размеров — без страха повесил его на стену на обычные дюбеля. По железу, к сожалению, ничего впечатляющего, к сожалению. Я сразу проверил работу моего приложения с трёхмерными игральными костями (HTML5 3D на three.js + физика cannon.js), и оно тормозит. Не так безбожно, как на SberBox, но всё-таки ни до уровня SberPortal, ни тем более до уровня мобильного телефона не дотягивает. Затем я запустил небольшую игру, которую недавно делал (HTML5 плеер на движке Godot, 2D + физика). И вот тут расстроился: игра работает, но буквально самую каплю ниже минимального предела комфорта. То есть, если бы она тормозила всего на 5% меньше, в неё уже можно было бы спокойно играть. А так нет. На Портале при этом игра работает шустро, на телефоне тоже шустро, но уже вне Салюта (в Салюте на телефоне не работает, не знаю, почему). Сама операционка вроде бы Android, но жутко урезанная. Для установки программ, которые мне нужны, пришлось скачивать APK. Причем, как именно это сделать было не ясно, и помогло только гугление. VLC завёлся штатно, YouTube отказался логиниться без гуглосервисов (к счастью, он есть внутри Салюта). Netflix я не нашёл ни в каком виде, и это провал. У нас с женой 60% экранного времени это именно Netflix. Ничто другое с ним не сравнится по соотношению нового контента к стоимости подписки. Для меня это самая главная причина, по которой я не стал бы ставить подобный телевизор в гостиной, как центральный экран в доме. Отдельно раздражает то, что предустановленные сервисы от самого Huawei невозможно удалить или даже спрятать. Они занимают всю полосу приложений на главном экране, но являются буквально мусором: покупать в России подписку на кино или музыку от Huawei глупо, мессенджером от Huawei тоже никто не пользуется. К самому экрану претензий нет — картинка сочная, качественная, разрешение отличное. Как устройство вывода для PlayStation 5 всё прекрасно. Ну, иногда может всплывать неотключаемое системное сообщение о каком-нибудь обновлении, но это мелочи. Камера сносная — не хватает звёзд с неба, но и не древняя вебка. Правда вот, на мой взгляд, она совершенно не нужна. Кейс «Люди разговаривают с кем-то по видеосвязи через телевизор» кажется мне целиком выдуманным маркетологами. А приложений, в которых камера могла бы раскрыться, в системе нет. Интеграция с Салютом, наоборот, выполнена хорошо. Даже если приложение «Салют» не запущено, устройство всё равно отзывается на голосовую команду без всякого пульта и активирует ассистента. Это меня приятно удивило, думал, будет такая же байда, как на СберБоксе, когда голосовой ввод, предполагающий занятость рук, всё равно вынуждает освободить руки и взять пульт. Однако, по непонятной причине не поддержана камера и жесты. Хотя, казалось бы, её и так мало где можно использовать, хоть здесь бы сделали. В целом, лично под мой сценарий использования девайс подошёл прекрасно: экран во всю стену в рабочем кабинете, на который главным образом выводится PS5, а ещё можно тестировать приложения Салюта при разработке. Но обычному пользователю покупать стоит с опаской. По моему мнению команда Сбера нормально выполнила интеграцию, но плохо выбрала донора для этой интеграции. #gadgets
Hashtags
Търсене: #recognition
@libreware · Post #1085 · 04.05.2022 г., 09:32
Wenet Automatic #Speech#Recognition toolkit. https://github.com/wenet-e2e/wenet https://wenet.org.cn/wenet/
Hashtags
@libreware · Post #1084 · 04.05.2022 г., 09:32
Vosk Speech Recognition Toolkit Vosk is an offline open source #speech#recognition toolkit. It enables speech recognition for 20+ languages and dialects - English, Indian English, German, French, Spanish, Portuguese, Chinese, Russian, Turkish, Vietnamese, Italian, Dutch, Catalan, Arabic, Greek, Farsi, Filipino, Ukrainian, Kazakh, Swedish, Japanese, Esperanto, Hindi, Czech. More to come. Vosk models are small (50 Mb) but provide continuous large vocabulary transcription, zero-latency response with streaming API, reconfigurable vocabulary and speaker identification. Speech recognition bindings implemented for various programming languages like Python, Java, Node.JS, C#, C++ and others. Vosk supplies speech recognition for chatbots, smart home appliances, virtual assistants. It can also create subtitles for movies, transcription for lectures and interviews. Vosk scales from small devices like Raspberry Pi or Android smartphone to big clusters. https://t.me/speech_recognition https://alphacephei.com/vosk https://github.com/alphacep/vosk-api
Hashtags
@libreware · Post #1021 · 09.01.2022 г., 14:56
SongRec An open-source Shazam client for Linux, written in Rust. Features: • Recognize audio from an audio file. • Recognize audio from the microphone. • Usage from both GUI and command line. • Provide an history of the recognized songs. • Continuous song detection. • Ability to recognize songs from your speakers rather than your microphone. Download: https://github.com/marin-m/SongRec#installation https://github.com/marin-m/SongRec @foss_desktop #music#shazam#recognition
Hashtags
@libreware · Post #1192 · 06.10.2023 г., 11:18
#Linux Desktop application that provides live #captioning FUTO Fellowship program interview; linux captions software 👉 Live Captions github: https://github.com/abb128/LiveCaptions 🔵 Q&A w/ billionaire alt-tech investor/philanthropist Eron Wolf https://www.youtube.com/watch?v=OJPmbcU-Vzo 🔵 FUTO Fellows program: https://futo.org/fellows/ 🔵 FUTO Youtube channel - @futotech ⚠️ Google's breaches of privacy have gone TOO FAR! https://www.youtube.com/watch?v=_vWAF13KigI #speech#recognition#stt#voice
@djangoproject · Post #448 · 18.09.2017 г., 11:30
https://medium.com/@GalarnykMichael/logistic-regression-using-python-sklearn-numpy-mnist-handwriting-recognition-matplotlib-a6b31e2b166a Logistic Regression using Python (#Sklearn, #NumPy, #MNIST, Handwriting #Recognition, #Matplotlib) #machine_learning.
@libreware · Post #1114 · 09.03.2023 г., 22:58
https://writeout.ai #Transcribe and #translate any #audio file. 100% free to use. This website with source code available (it can be hosted locally) allows you to upload any audio file and receive a transcription and/or text translation. It uses OpenAI's Whisper API on the back end. Source on GitHub: https://github.com/beyondcode/writeout.ai #writeout#ai#speech#recognition