TGTGInsighttelegram intelligenceLIVE / telegram public index
← GitHub Trends

TGINSIGHT SIMILAR POSTS

Find similar content

Source channel @githubtrending · Post #15421 · Jan 18

#python#audio#deeplearning#minicpm#python#pytorch#speech#speech_synthesis#text_to_speech#tts#tts_model#voice_cloning VoxCPM is a free, open-source TTS tool that turns text into realistic speech without tokens, creating expressive audio that matches context and clones voices perfectly from just 3-10 seconds of sample. Download VoxCPM1.5 (800M params) from Hugging Face, install via pip, and use simple Python or CLI commands for fast synthesis (RTF 0.15 on RTX 4090) or fine-tuning your own voices. You benefit by easily making natural audiobooks, podcasts, clones, or apps with pro-quality sound—saving time and costs on voice work. https://github.com/OpenBMB/VoxCPM

Results

2 similar posts found

Search: #a1111

当前筛选 #a1111清除筛选
PHYGITAL+CREATIVE

@phygitalcreative · Post #2967 · 05/22/2023, 11:19 AM

Вы наверняка слышали про Instruct pix2pix. Это модель, которая позволяет менять картинку на основе текстового запроса типа "make his hair blue" или "turn it into a wood carving". Так вот, изначальный вариант pix2pix, который был реализован в Автоматике, уже устарел. Теперь гораздо удобнее пользоваться pix2pix моделью КонтролНета. Она позволяет работать с хайрезными изображениями и в ней не нужно париться с двойной настройкой Denoising strength. Работает прямо в text2image. Добавьте исходную картинку в ControlNet, оставьте препроцессор в "none", выберите модель "Control_v11e_sd15_ip2p", поставьте правильное разрешение картинки, наберите вашу инструкцию в поле промпта и жмите Generate. Например я взял исходную картинку с древним городом, превратил ее в схематичный рисунок, в зимнюю сцену и в ночную с огнём. #совет#A1111#stablehoudini

Всем привет! Добро пожаловать в 👾 Нейро-Софт! Для навигации по каналу используйте карту тегов ⤵️: #txt2img - Нейросети для генерации изображений по текстовому описанию. #img2img - Нейросети для изменения или стилизации изображений на основе других изображений. #txt2video - Нейросети для генерации видео по текстовому описанию. #img2video - Нейросети для создания видео на основе изображений. #deepfake - Нейросети для создания дипфейков и замены лиц в видео. #music - Нейросети для генерации музыки. #voicecloning - Нейросети для клонирования голоса. #tts - Нейросети для синтеза речи из текста. #stt - Нейросети для распознавания речи и перевода её в текст. #txt2txt - Нейросети для генерации текста, анализа текста и перевода. #multimodal - Нейросети, комбинирующие текст с изображениями или видео. #style - Нейросети для стилизации и переноса стиля. #creative - Инструменты для создания визуальных эффектов и художественного творчества. #stablediffusion - Нейросети для генерации изображений на базе модели Stable Diffusion. #controlnet - Нейросети использующие принципы или модели ControlNet, например Instant ID. #fooocus - Репаки и форки Fooocus. #forge - Репаки и форки Forge. #a1111 - Репаки и форки Automatic 1111. #llm - Большие языковые модели для генерации и анализа текста. 💬Обсудить в чате | ⭐️Поддержать канал 👾НЕЙРО-СОФТ — Делаем нейросети доступнее.