@libreware · Post #1085 · 04.05.2022 г., 09:32
Wenet Automatic #Speech#Recognition toolkit. https://github.com/wenet-e2e/wenet https://wenet.org.cn/wenet/
Hashtags
TGINSIGHT SIMILAR POSTS
Изходен канал @clockstackwheels · Post #926 · 12.12
Была такая якутская геймдев-студия Fntastic. Выпустила несколько малоизвестных игр и 4 года назад взялась за масштабный проект: MMO в жанре зомби-апокалипсиса под названием The Day Before. Студия изредка выкидывала в сеть материалы по игре: трейлеры, скриншоты, посетила пару выставок, в целом снаружи выглядело как обычный геймдев-долгострой. И вот 7-го декабря игра вышла в ранний доступ. Формально ранний доступ позволяет предложить игрокам продукт в любой степени готовности: игроки покупают что-то вроде демо-версии фактически за полную сумму в обмен на обещания разработчиков, что проект будет на эти деньги доделан. Местами это очень даже хороший работающий механизм: моя любимая #Satisfactory уже несколько лет не вылезает из раннего доступа, и в ней куча проблем, при этом я с огромным удовольствием провёл в ней больше часов, чем в какой-либо другой игре вообще за всю историю моего гейминга. И обязательно вернусь (пока взял паузу из-за пресыщения). Так вот. The Day Before в раннем доступе оказалась не просто недоделанной, по ней стало очевидно, что требуется ещё много лет и очень много денег, чтобы привести её хотя бы приблизительно в удобоваримое состояние. А трейлеры и скриншоты были просто обманом. Собрав по меньшей мере несколько десятков тысяч продаж (стоимость игры составляла около 1300 рублей в России и чуть больше в Европе и США), студия Fntastic вчера объявила о закрытии из-за "финансового краха". Написали примерно следующее: "Этих денег нам хватит, чтобы отдать долги, но слишком мало, чтобы продолжить разработку, всем спасибо, расходимся". Никогда такого не было, чтобы кто-нибудь брал деньги вперёд и уходил с ними в закат! Большинство комментаторов в сети — и я к ним присоединяюсь — уверены, что это заведомо мошенническая схема. Разработчики увидели, что доделать игру у них не получается, попытались продать как можно больше и свернуть лавочку. С точки зрения закона сложно придраться — игроков никто покупать не заставлял, и о том, что игра в раннем доступе, все знали в момент покупки. Теоретически люди сами виноваты, что не почитали никаких обзоров от первых купивших, а поверили трейлерам и обещаниям. Но здесь я хочу сделать акцент на второй глобальной проблеме капитализма (первая это монополии): искусственное раздувание ценности. В теории рыночная экономика должна мотивировать бизнес делать что-то полезное, интересное и нужное человечеству. Сделал хорошо, у тебя это покупают, все в плюсе. На практике мы видим, что вполне работоспособной является следующая схема: вместо того, чтобы тратить ресурсы на создание ценности, можно тратить ресурсы на _убеждение_ людей в наличии ценности. Зачем делать хороший продукт за миллион долларов, если можно сделать его за сто тысяч, ещё пятьсот вложить в маркетинг и просто убедить людей в том, что он хороший? Ну или если вообще у тебя нет специалистов, способных сделать хороший продукт, если это долго и сложно. Рыночная экономика помогает процветать миллиону схем, работающих только на маркетинге и других способах воздействия на людей, безотносительно того, а есть ли вообще продукт. На рынке цифровых продуктов, особенно игр, это очень частая ситуация. Если вы думаете, что только ноунейм-якуты выпускают недоделку вместо обещанного, то ошибаетесь: в этом году вышла Starfield от одной из крупнейших мировых студий разработки, и там тоже разрыв между созданными маркетингом ожиданиями и реальностью огромный. #games
Hashtags
Търсене: #recognition
@libreware · Post #1085 · 04.05.2022 г., 09:32
Wenet Automatic #Speech#Recognition toolkit. https://github.com/wenet-e2e/wenet https://wenet.org.cn/wenet/
Hashtags
@libreware · Post #1084 · 04.05.2022 г., 09:32
Vosk Speech Recognition Toolkit Vosk is an offline open source #speech#recognition toolkit. It enables speech recognition for 20+ languages and dialects - English, Indian English, German, French, Spanish, Portuguese, Chinese, Russian, Turkish, Vietnamese, Italian, Dutch, Catalan, Arabic, Greek, Farsi, Filipino, Ukrainian, Kazakh, Swedish, Japanese, Esperanto, Hindi, Czech. More to come. Vosk models are small (50 Mb) but provide continuous large vocabulary transcription, zero-latency response with streaming API, reconfigurable vocabulary and speaker identification. Speech recognition bindings implemented for various programming languages like Python, Java, Node.JS, C#, C++ and others. Vosk supplies speech recognition for chatbots, smart home appliances, virtual assistants. It can also create subtitles for movies, transcription for lectures and interviews. Vosk scales from small devices like Raspberry Pi or Android smartphone to big clusters. https://t.me/speech_recognition https://alphacephei.com/vosk https://github.com/alphacep/vosk-api
Hashtags
@libreware · Post #1021 · 09.01.2022 г., 14:56
SongRec An open-source Shazam client for Linux, written in Rust. Features: • Recognize audio from an audio file. • Recognize audio from the microphone. • Usage from both GUI and command line. • Provide an history of the recognized songs. • Continuous song detection. • Ability to recognize songs from your speakers rather than your microphone. Download: https://github.com/marin-m/SongRec#installation https://github.com/marin-m/SongRec @foss_desktop #music#shazam#recognition
Hashtags
@libreware · Post #1192 · 06.10.2023 г., 11:18
#Linux Desktop application that provides live #captioning FUTO Fellowship program interview; linux captions software 👉 Live Captions github: https://github.com/abb128/LiveCaptions 🔵 Q&A w/ billionaire alt-tech investor/philanthropist Eron Wolf https://www.youtube.com/watch?v=OJPmbcU-Vzo 🔵 FUTO Fellows program: https://futo.org/fellows/ 🔵 FUTO Youtube channel - @futotech ⚠️ Google's breaches of privacy have gone TOO FAR! https://www.youtube.com/watch?v=_vWAF13KigI #speech#recognition#stt#voice
@djangoproject · Post #448 · 18.09.2017 г., 11:30
https://medium.com/@GalarnykMichael/logistic-regression-using-python-sklearn-numpy-mnist-handwriting-recognition-matplotlib-a6b31e2b166a Logistic Regression using Python (#Sklearn, #NumPy, #MNIST, Handwriting #Recognition, #Matplotlib) #machine_learning.
@libreware · Post #1114 · 09.03.2023 г., 22:58
https://writeout.ai #Transcribe and #translate any #audio file. 100% free to use. This website with source code available (it can be hosted locally) allows you to upload any audio file and receive a transcription and/or text translation. It uses OpenAI's Whisper API on the back end. Source on GitHub: https://github.com/beyondcode/writeout.ai #writeout#ai#speech#recognition