TGTGInsightаналитика telegramLIVE / telegram public index
Содержимое поста
Содержимое
Ого... В опенсорс выложили TTS-модель уровня ElevenLabs! 🤯 Fish Audio представили Fish Audio S2. Модель выдает голос с задержкой до 150 мс и тянет сразу несколько голосов за одну генерацию. Самое крутое: можно детально настраивать эмоции. Просто меняете ползунок, и нейросеть читает текст то спокойным голосом, то срывается на крик. Гитхаб Потестить тут