TGTGInsighttelegram intelligenceLIVE / telegram public index
← GitHub Trends

TGINSIGHT SIMILAR POSTS

Find similar content

Source channel @githubtrending · Post #15421 · Jan 18

#python#audio#deeplearning#minicpm#python#pytorch#speech#speech_synthesis#text_to_speech#tts#tts_model#voice_cloning VoxCPM is a free, open-source TTS tool that turns text into realistic speech without tokens, creating expressive audio that matches context and clones voices perfectly from just 3-10 seconds of sample. Download VoxCPM1.5 (800M params) from Hugging Face, install via pip, and use simple Python or CLI commands for fast synthesis (RTF 0.15 on RTX 4090) or fine-tuning your own voices. You benefit by easily making natural audiobooks, podcasts, clones, or apps with pro-quality sound—saving time and costs on voice work. https://github.com/OpenBMB/VoxCPM

Results

1 similar post found

Search: #aigraphics

当前筛选 #aigraphics清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #9075 · 11/25/2025, 05:34 PM

⚡️ Релиз Flux 2 Модель получила значительный апгрейд . Теперь она учитывает до десяти референсов сразу, лучше понимает свет, материалы и оптику, аккуратнее рендерит текст и выдаёт качество до 4k. Генерации выглядят ровнее и реалистичнее, без пластикового блеска. Можно генерировать, редактировать и совмещать изображения. Веса открытые, так что при желании можно запускать локально (65 ГБ). 🟠Demo: https://playground.bfl.ai/image/generate 🟠Weights: https://huggingface.co/black-forest-labs 🟠HF: https://huggingface.co/black-forest-labs/FLUX.2-dev @ai_machinelearning_big_data #AI#Flux2#ImageGeneration#AIGraphics