Find similar content

Source channel @githubtrending · Post #15421 · Jan 18

#python#audio#deeplearning#minicpm#python#pytorch#speech#speech_synthesis#text_to_speech#tts#tts_model#voice_cloning VoxCPM is a free, open-source TTS tool that turns text into realistic speech without tokens, creating expressive audio that matches context and clones voices perfectly from just 3-10 seconds of sample. Download VoxCPM1.5 (800M params) from Hugging Face, install via pip, and use simple Python or CLI commands for fast synthesis (RTF 0.15 on RTX 4090) or fine-tuning your own voices. You benefit by easily making natural audiobooks, podcasts, clones, or apps with pro-quality sound—saving time and costs on voice work. https://github.com/OpenBMB/VoxCPM

Hashtags

#python #audio #deeplearning #minicpm #pytorch #speech #speech_synthesis #text_to_speech #tts #tts_model #voice_cloning

Results

2 similar posts found

Search: #tongyi

当前筛选 #tongyi清除筛选

Machinelearning

@ai_machinelearning_big_data · Post #9101 · 11/27/2025, 02:10 PM

Find similar View

💡Релиз Z-Image: быстрая 6B модель Команда Tongyi-MAI представила новую text-to-image архитектуру на 6 миллиардов параметров. Главное из отчета: * Оптимизация: Это дистиллированная модель, которой достаточно 8 шагов (NFE) для качественной генерации. * Скорость: Sub-second latency (менее 1 секунды) на H800. * Требования: Спокойно запускается на 16GB VRAM. Модель доступна для локального инференса на старших картах 3090/4080/4090. Моделька выделит высокий уровень фотореализма, точное следование инструкциям и рендеринг текста. 🔗Демо:https://modelscope.cn/aigc/imageGeneration 🔗Веса (Turbo):https://modelscope.cn/models/Tongyi-MAI/Z-Image-Turbo @ai_machinelearning_big_data #Tongyi#ai#genai#ml

Hashtags

#tongyi #ai #genai #ml

Machinelearning

@ai_machinelearning_big_data · Post #9496 · 02/09/2026, 02:33 PM

Find similar View

⚡️Вышла Z-Image Base. Tongyi выложила фундаментальную версию модели семейства Z-Image. В отличие от ранее выпущенной Turbo, это полновесный трансформер, ориентированный на максимальное качество и управляемость генерации . Z-Image отлично подходит для дообучения, тренировки LoRA и интеграции с ControlNet. Модель поддерживает CFG и работу с негативными промптами, генерируя результат за 28–50 шагов. 📌Лицензирование: Apache 2.0 License. 🟡Модель 🟡Демо HF 🟡Демо ModelScope 🟡Archive 🟡ComfyUI WorkFlow 🖥GitHub @ai_machinelearning_big_data #AI#ML#Diffusion#ZImage#Tongyi

Hashtags

#ai #ml #diffusion #zimage #tongyi