TGTGInsighttelegram intelligenceLIVE / telegram public index
← GitHub Trends

TGINSIGHT SIMILAR POSTS

Find similar content

Source channel @githubtrending · Post #15421 · Jan 18

#python#audio#deeplearning#minicpm#python#pytorch#speech#speech_synthesis#text_to_speech#tts#tts_model#voice_cloning VoxCPM is a free, open-source TTS tool that turns text into realistic speech without tokens, creating expressive audio that matches context and clones voices perfectly from just 3-10 seconds of sample. Download VoxCPM1.5 (800M params) from Hugging Face, install via pip, and use simple Python or CLI commands for fast synthesis (RTF 0.15 on RTX 4090) or fine-tuning your own voices. You benefit by easily making natural audiobooks, podcasts, clones, or apps with pro-quality sound—saving time and costs on voice work. https://github.com/OpenBMB/VoxCPM

Results

2 similar posts found

Search: #emnlp

当前筛选 #emnlp清除筛选
Семён: Нейросети в каждый дом

@semasci · Post #1247 · 08/21/2025, 07:28 AM

🎉 Нашу статью приняли на EMNLP 2025 в Main Track. 💪 Выводим распознавание жестовых языков на новый качественный уровень. В статье достигаем state-of-the-art🌿 на жестовых языках разных стран, включая в первую очередь русский жестовый язык (РЖЯ). Показываем, что качественный претрейн и предобработка — залог успеха. Спасибо авторам: @your_petros@ilyaovodov@nagadit@hukenovs@karinakvanchiani 📝Жестовый язык: похожее в непохожем и наоборот 📖Logos as a Well-Tempered Pre-train for Sign Language Recognition До встречи на конференции! #research#rsl#emnlp

Семён: Нейросети в каждый дом

@semasci · Post #1316 · 11/09/2025, 07:33 AM

BORSch покорил наши сердца Сегодня русскоязычное сообщество на EMNLP обсуждает работу BORSch, в которой авторы исследуют особенности знания мультимодальных моделей кухни постсоветского пространства. С этой целью они собрали мультимодальный датасет BORSch, включающий 1147 русскоязычных и 823 украиноязычных блюда, относящихся к странам постсоветского региона. Например: Откуда блюдо кывырма? + фото кывырмы Gold answer: Gagauzia (🇲🇩 Moldova) На примере BORSch авторы показывают, что даже передовые модели испытывают трудности при определении происхождения блюд из постсоветских стран — как в текстовой, так и в мультимодальной задаче Question Answering (QA): вместо правильного ответа они чаще отдают предпочтение стране, на языке которой был написан промпт. Вывод (ИМХО): когда используете LLM для личных целей, не забывайте включать функцию Search (искать в сети). Не мучайте моделей кывырмой и эчпочмаками, Гугл — наше всё. Хотя, подозреваю, что с происхождением блюд на разных языках тоже может возникать диссонанс. А работа и правда стоящая, особенно здорово, что с акцентом на постсовесткие языки. @mashkka_ds #llm#emnlp#новостисполей#трудовыебудни