TGTGInsighttelegram intelligenceLIVE / telegram public index
← GitHub Trends

TGINSIGHT SIMILAR POSTS

Find similar content

Source channel @githubtrending · Post #15421 · Jan 18

#python#audio#deeplearning#minicpm#python#pytorch#speech#speech_synthesis#text_to_speech#tts#tts_model#voice_cloning VoxCPM is a free, open-source TTS tool that turns text into realistic speech without tokens, creating expressive audio that matches context and clones voices perfectly from just 3-10 seconds of sample. Download VoxCPM1.5 (800M params) from Hugging Face, install via pip, and use simple Python or CLI commands for fast synthesis (RTF 0.15 on RTX 4090) or fine-tuning your own voices. You benefit by easily making natural audiobooks, podcasts, clones, or apps with pro-quality sound—saving time and costs on voice work. https://github.com/OpenBMB/VoxCPM

Results

1 similar post found

Search: #3dgenai

当前筛选 #3dgenai清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8630 · 09/26/2025, 12:45 PM

✔️ Tencent представила Hunyuan3D-Omni: первую в индустрии модель для генерации 3D-объектов с мультиконтрольным управлением. Модель ростроенная на базе open-source Hunyuan3D 2.1 и называемая «ControlNet для 3D», система решает проблемы кривых генераций и искажённой геометрии, интегрируя до четырёх условий контроля. Две ключевые инновации: - Лёгкий унифицированный энкодер управления для эффективного мультимодального фьюжна - Стратегия прогрессивного обучения по сложности, повышающая устойчивость модели Возможности: - Управление по одному изображению и наброску позволяет точно задавать позы для анимаций и аватаров - Использование облака точек (полного или построенного по глубине): убирает визуальную неопределённость и обеспечивает реалистичную геометрию - Контроль через bounding box: задаёт пропорции объекта (длину, ширину и высоту) в соответствии с дизайном - Voxel-контроль: формирует топологию объекта, что удобно и для инженерных, и для творческих сценариев Tencent дропнули код и веса. 🟢Код: https://github.com/Tencent-Hunyuan/Hunyuan3D-Omni 🟢Веса: https://huggingface.co/tencent/Hunyuan3D-Omni 🟢Отчёт: https://arxiv.org/pdf/2509.21245 @ai_machinelearning_big_data #3DGenAI#TencentHunyuan#OpenSourceAI