TGTGInsighttelegram intelligenceLIVE / telegram public index
Post content
帖子内容
#文本转语音#语音合成#人工智能#TTS#克隆#特别推荐 ㅤ 🎤标杆级开源语音大模型 VoxCPM:零样本克隆,让机器拥有“情感灵魂”! ㅤ 近期,由 OpenBMB 推出的文本转语音(TTS)系统 VoxCPM 火爆整个 AI 圈!该项目凭借惊艳的生成效果,目前在 GitHub 上已狂揽近 1.2 万颗 Star🌟,并曾强势登顶 GitHub 和 HuggingFace 的趋势榜首,是当下最受关注的开源语音项目之一! ㅤ ✨ 核心黑科技一览: ㅤ • 🗣️突破性无分词器: 抛弃传统离散设计,直接生成连续语音,告别机械感,声音极其自然连贯。 • 🌍精通 30 国语言: 原生支持中、英、日、法等 30 种语言及 9 种中文方言,无需手动切换,多语种混排毫无压力。 • 🎨一句话“捏”音色: 零样本生成!无需提供任何参考音频,只需输入文字描述(如“年轻女性,声音温柔甜美”),即可凭空创造出全新声音。 • 🎛️极致声音克隆: 仅需几秒参考音频,就能完美复刻原声的音色、情感、停顿甚至是呼吸节奏。 • 🎧48kHz 录音室音质: 自带超分黑科技,即便是 16kHz 的低音质输入,也能直接输出 48kHz 的高清录音室级音质。 • ⚡极速流式推理: 搭配专属并发引擎,延迟极低(RTX 4090 下 RTF 低至 0.13),完美适配实时语音交互对话。 📝支持的中国方言:四川话、粤语、吴语、东北话、河南话、陕西话、山东话、天津话、闽南话 🔘@TossLab🔘@TossLabChannel