@libreware · Post #1085 · 04.05.2022 г., 09:32
Wenet Automatic #Speech#Recognition toolkit. https://github.com/wenet-e2e/wenet https://wenet.org.cn/wenet/
Hashtags
TGINSIGHT SIMILAR POSTS
Изходен канал @clockstackwheels · Post #951 · 9.02
У нас в Росатоме сотрудникам иногда предлагают ездить смотреть на разные предприятия госкорпорации. Вот удалось скататься за счёт компании в Мурманск, попасть на Атомфлот и на ледокол-музей «Ленин». Мурманск сам по себе показался мне особенно примечательным своим рельефом: дворы на разном уровне и для перемещения от дома к дому нужно то и дело ходить по лестницам. В целом же конечно после Петербурга он смотрится простовато, а некоторые дома в глубине откровенно страшные и с точки зрения жителя столиц выглядят чуть ли не аварийно. Здание аэропорта вообще похоже на среднестатистическую коробку государственной конторы где-нибудь во дворах. Однако, ведётся строительство нового аэропорта. И, вообще, приятно удивляет сам факт, что в таких тяжёлых условиях есть вполне современный развитый город, в котором присутствует всё, к чему мы привыкли в плане сервисов и комфорта: от топовых отелей до Яндекс Такси. Правда, я жил в квартире, потому что отели в ноль раскупили китайцы. Говорят, у них есть такое поверье, что в дни зачатия ребёнка нужно увидеть Полярное Сияние, вот они и летят в Мурманск толпами. На Атомфлоте почти ничего нельзя было фотографировать. В доке в этот момент стоял красивый ледокол «Сибирь» из новой универсальной серии проекта 22220. Эта машина с двумя реакторами по 175 МВт может менять свою осадку и одинаково подходит как для ведения судов по Северному Морскому Пути, так и для работы в крупных замерзающих зимой реках, таких, как Енисей и Обь. Зато есть снимок из центра морских операций, куда выводят интерактивную карту местоположения всех ледоколов и спутниковый анализ плотности льда во всём арктическом регионе. А ещё глянули на тренажёры, за которыми учатся и сдают экзамены операторы ядерной установки. На фото тренажёр, который дублирует пульт довольно старого ледокола 70-х годов, но ещё в ходу; а у новых дисплеи и трекпады везде. Так вот, работа этих операторов похожа на то, что нам показывали в сериале «Звёздный Путь», когда капитан просит машинное отделение дать мощности на варп-ядро, чтобы сделать быстрый скачок, и инженеры начинают быстро перебирать кнопки, а индикаторы менять своё состояние. Ледокол «Ленин» это первое в мире надводное атомное судно. Сейчас он снят с эксплуатации и превращён в музей. В то время для его работы требовался персонал порядка 250 человек. У современных ледоколов эта цифра около 50, хотя они больше, сложнее и мощнее, потому что много работы выполняет теперь автоматика. Ещё два интересных факта: 1. Ледоколу часто нужно рывками с разбегу преодолевать какой-то особо сложный участок, и именно поэтому установка у него электрическая, а не прямой привод от турбин реактора. Электричество даёт большую динамику. 2. Если ледокол застрял во льдах, у него есть специальная система изменения центра тяжести, позволяющая ему раскачиваться вперёд-назад и влево-вправо, чтобы чуть-чуть освободиться, а дальше уже рывками выбраться. В общем и целом понравилось. Я бы и сам с удовольствием съездил, а тут ещё и на работе предложили. Но в Мурманске и вообще за Полярным Кругом ещё много всего можно посмотреть, это уже в личном порядке надо будет. #travel#life
Търсене: #recognition
@libreware · Post #1085 · 04.05.2022 г., 09:32
Wenet Automatic #Speech#Recognition toolkit. https://github.com/wenet-e2e/wenet https://wenet.org.cn/wenet/
Hashtags
@libreware · Post #1084 · 04.05.2022 г., 09:32
Vosk Speech Recognition Toolkit Vosk is an offline open source #speech#recognition toolkit. It enables speech recognition for 20+ languages and dialects - English, Indian English, German, French, Spanish, Portuguese, Chinese, Russian, Turkish, Vietnamese, Italian, Dutch, Catalan, Arabic, Greek, Farsi, Filipino, Ukrainian, Kazakh, Swedish, Japanese, Esperanto, Hindi, Czech. More to come. Vosk models are small (50 Mb) but provide continuous large vocabulary transcription, zero-latency response with streaming API, reconfigurable vocabulary and speaker identification. Speech recognition bindings implemented for various programming languages like Python, Java, Node.JS, C#, C++ and others. Vosk supplies speech recognition for chatbots, smart home appliances, virtual assistants. It can also create subtitles for movies, transcription for lectures and interviews. Vosk scales from small devices like Raspberry Pi or Android smartphone to big clusters. https://t.me/speech_recognition https://alphacephei.com/vosk https://github.com/alphacep/vosk-api
Hashtags
@libreware · Post #1021 · 09.01.2022 г., 14:56
SongRec An open-source Shazam client for Linux, written in Rust. Features: • Recognize audio from an audio file. • Recognize audio from the microphone. • Usage from both GUI and command line. • Provide an history of the recognized songs. • Continuous song detection. • Ability to recognize songs from your speakers rather than your microphone. Download: https://github.com/marin-m/SongRec#installation https://github.com/marin-m/SongRec @foss_desktop #music#shazam#recognition
Hashtags
@libreware · Post #1192 · 06.10.2023 г., 11:18
#Linux Desktop application that provides live #captioning FUTO Fellowship program interview; linux captions software 👉 Live Captions github: https://github.com/abb128/LiveCaptions 🔵 Q&A w/ billionaire alt-tech investor/philanthropist Eron Wolf https://www.youtube.com/watch?v=OJPmbcU-Vzo 🔵 FUTO Fellows program: https://futo.org/fellows/ 🔵 FUTO Youtube channel - @futotech ⚠️ Google's breaches of privacy have gone TOO FAR! https://www.youtube.com/watch?v=_vWAF13KigI #speech#recognition#stt#voice
@djangoproject · Post #448 · 18.09.2017 г., 11:30
https://medium.com/@GalarnykMichael/logistic-regression-using-python-sklearn-numpy-mnist-handwriting-recognition-matplotlib-a6b31e2b166a Logistic Regression using Python (#Sklearn, #NumPy, #MNIST, Handwriting #Recognition, #Matplotlib) #machine_learning.
@libreware · Post #1114 · 09.03.2023 г., 22:58
https://writeout.ai #Transcribe and #translate any #audio file. 100% free to use. This website with source code available (it can be hosted locally) allows you to upload any audio file and receive a transcription and/or text translation. It uses OpenAI's Whisper API on the back end. Source on GitHub: https://github.com/beyondcode/writeout.ai #writeout#ai#speech#recognition