TGTGInsighttelegram intelligenceLIVE / telegram public index
← () => "翠楼屋"

TGINSIGHT SIMILAR POSTS

查找相似内容

Source channel @lambdaexpression · Post #310 · 2月13日

by iPhone13 Pro #摄影

Hashtags

Results

找到 17 条相似帖子

搜索 #nerualdreming

当前筛选 #nerualdreming清除筛选

🐟 Fish OpenAudio S1 Mini ● Синтез речи и клонирование голоса ● RU+EN ● Portable by Nerual Dreming Ссылка на оригинальный релиз:https://huggingface.co/spaces/fishaudio/openaudio-s1-mini Репакер:#NerualDreming Дата обновления: 15 июня 2025 Версия: 1.0 Категории:#TTS, #voicecloning, #AIaudio Платформа:#Windows Язык: RU, EN Место на диске: 11 ГБ Системные требования: NVIDIA GPU с не менее 6 ГБ VRAM Совместимость:#Nvidia 🖥Описание софта: OpenAudio S1 Mini — это значительный шаг вперед по сравнению с ее предшественницей, Fish Speech 1.5. Главное преимущество модели — превосходная выразительность и естественность звучания, которые достигаются за счет совершенного управления эмоциональными оттенками с помощью специальных маркеров. Будучи «дистиллированной» версией более крупной модели, она предлагает передовые возможности в значительно более легком и ресурсоэффективном пакете, что делает ее доступной для широкого круга пользователей. 😬 Основные возможности OpenAudio S1 Mini: 🟣 Превосходная выразительность: Управляйте эмоциями и тоном с помощью более 50 маркеров. 🟣 Высокое качество звука: Благодаря обучению с подкреплением на основе отзывов человека (RLHF), модель генерирует более естественное и приятное звучание. 🟣 Клонирование голоса: Возможность клонировать любой голос по короткому аудиофрагменту (10-30 секунд). 🟣 Встроенная библиотека голосов: Пак из более чем 50 готовых русскоязычных и англоязычных голосов. 🟣 Оптимизация для русского языка: Настройки по умолчанию адаптированы для качественного синтеза русской речи. 🟣 Эффективность: Легковесная модель (0.5 млрд параметров) потребляет меньше ресурсов, чем ее предшественники. 🟣 Высокие позиции в бенчмарках TTS-Arena. 💡 Как использовать маркеры эмоций: Для управления интонацией просто добавьте нужный маркер в скобках в ту часть текста, где должна измениться эмоция. Модель поймет эту команду и сгенерирует речь с соответствующим оттенком. Эмоциональные маркеры: (angry) (sad) (disdainful) (excited) (surprised) (satisfied) (unhappy) (anxious) (hysterical) (delighted) (scared) (worried) (indifferent) (upset) (impatient) (nervous) (guilty) (scornful) (frustrated) (depressed) (panicked) (furious) (empathetic) (embarrassed) (reluctant) (disgusted) (keen) (moved) (proud) (relaxed) (grateful) (confident) (interested) (curious) (confused) (joyful) (disapproving) (negative) (denying) (astonished) (serious) (sarcastic) (conciliative) (comforting) (sincere) (sneering) (hesitating) (yielding) (painful) (awkward) (amused) Тональные маркеры: (in a hurry tone) (shouting) (screaming) (whispering) (soft tone) Специальные маркеры: (laughing) (chuckling) (sobbing) (crying loudly) (sighing) (panting) (groaning) (crowd laughing) (background laughter) (audience laughing) ⚠️По моему мнению для русского языка не подходит! Коверкает ударения, но попробуйте на других языках. Модель поддерживает: English (en), Chinese (zh), Japanese (ja), German (de), French (fr), Spanish (es), Korean (ko), Arabic (ar), Russian (ru), Dutch (nl), Italian (it), Polish (pl), Portuguese (pt) 💿Установка и запуск: ⁍ Скачайте полный 7z-архив с моделями и окружением. ⁍ Распакуйте архив в удобное место с помощью 7-Zip. ⁍ Для запуска русской версии запустите файл run_ru.bat. ⁍ Для запуска английской версии запустите файл run_en.bat. ⁍ Интерфейс приложения автоматически откроется в вашем браузере. ➡️ Скачать архиватор 7z ➡️Скачать OpenAudio S1 Mini Portable — полный архив 7z с окружением и моделью 💬Обсудить в чате | ⭐️Поддержать канал 👾НЕЙРО-СОФТ — Делаем нейросети доступнее.

🐠 Fish Speech MOD ● Модифицированная версия синтезатора речи с клонированием голоса ● RU ● Portable by NerualDreming Ссылка на оригинальный GitHub:https://github.com/fishaudio/fish-speech Репакер:#NerualDreming Дата обновления: 15 января 2025 Версия: 1.4.3 Категории:#TTS, #voiceclone, #AIaudio Платформа:#Windows Язык: RU Место на диске: 10 ГБ Системные требования: NVIDIA GPU 8gb Совместимость:#Nvidia 🖥Описание софта: Fish Speech - это мощный инструмент для синтеза речи с возможностью клонирования голоса. Особенность данной модифицированной версии в том, что она адаптирована для русскоязычных пользователей и дополнена новыми функциями для более удобной работы. 😬Основные возможности Fish Speech: 🟣 Клонирование голоса по образцу 15-60 секунд 🟣 Поддержка русского и других языков (английский, японский, корейский, китайский, французский, немецкий, арабский, испанский) 🟣 Высокая точность синтеза речи 🟣 Сохранение в форматах MP3 и FLAC 🟣 Полностью русифицированный интерфейс 🟣 Упрощенная работа с папкой examples - достаточно добавить MP3 и текстовый файл с расшифровкой для добавления новых голосов 🟣 Оптимизированный интерфейс без неиспользуемых элементов 📣Встроенные голоса: 🔘 Крастер (YouTube) 🔘 Губка Боб 🔘 Тинькофф (YouTube) 🔘 Кропина (YouTube, женский) 🔘 Бухмин (AudioBook) 🔘 Володарский 🔘 Гоблин Пучков (YouTube) 🔘 Дедпул (Гланц) 🔘 Денис Колесников (YouTube) 🔘 5 дополнительных женских голосов на английском языке ⚠️Отказ от ответственности: Все примеры голосов взяты из открытых источников и представлены с уважением к их носителям и исключительно в демонстрационных целях. Для коммерческого использования рекомендуем обращаться к авторам. Несанкционированное использование чужих голосов в коммерческих целях и без разрешений не только нарушает права их владельцев, но и может преследоваться по закону. Мы категорически запрещаем и осуждаем использование данной технологии для нарушения чьих-либо прав или для совершения противоправных действий! 💿Установка и запуск: ⁍ Скачайте zip архив Fish Speech ⁍ Распакуйте архив в удобное место ⁍ Запустите файл install.bat ⁍ Дождитесь окончания установки (будет выведено соответствующее сообщение) ⁍ Запустите start.bat для начала работы ➡️Скачать Fish Speech Mod Portable ZIP — обычный ZIP архив 💬Обсудить в чате | ⭐️Поддержать канал 👾НЕЙРО-СОФТ — Делаем нейросети доступнее.

👏FLUX.1 dev NF4 Quantized ● Лучшая модель для генерации изображений ● RU ● Portable by Nerual Dreming Ссылка на оригинальный релиз:https://huggingface.co/black-forest-labs/FLUX.1-dev Репакер:#NerualDreming Дата обновления: 10 августа 2024 Версия: 1.0 Категории:#txt2img, #img2img, #AIart Платформа:#Windows Язык: RU Место на диске: 38 ГБ Системные требования: NVIDIA GPU с не менее 16 ГБ VRAM, 32 ГБ RAM Совместимость:#Nvidia Лицензия:Некоммерческая лицензия 🖥Описание софта: FLUX.1 dev - это мощная модель генерации изображений по текстовому описанию, основанная на 12-миллиардном трансформере с выпрямленным потоком. Эта дистиллированная квантованная версия позволяет запускать модель на бытовых видеокартах, сохраняя высокое качество генерации. 😬 Основные возможности FLUX.1 dev NF4 Quantized: 🔘 Высочайшее качество генерации, уступающее только FLUX.1 pro 🔘 Отличное следование промпту, сравнимое с закрытыми аналогами такими как DALL-E 3, Midjourney, Ideogram 🔘 Повышенная эффективность и скорость генерации благодаря дистилляции 🔘Невероятное качество генерации текста на изображениях 🔘 Открытая модель для научных исследований и творческих экспериментов 🔘 Поддержка различных соотношений сторон и разрешений 🔘 Добавлена поддержка img2img 🔘 Возможность настройки количества шагов генерации ⚠️Важно: Генерация на видеокартах с объемом памяти менее 24 ГБ может занимать значительное время. На RTX 4090 генерация занимает всего 16 секунд. 💿Установка и запуск: ⁍ Скачайте самораспаковывающийся архив Flux1-dev-nf4-neuroport.exe или одноименный ZIP-архив. ⁍ Если вы скачали EXE, запустите его и выберите папку для распаковки. Если ZIP, распакуйте его в удобное место. ⁍ После распаковки запустите файл start_flux_portable.bat. ⁍ Дождитесь загрузки компонентов, после чего интерфейс откроется в браузере. ⁍ Чтобы включить темную тему, добавьте в конце URL адреса /?__theme=dark ⚠️Примечание: Если вы выбрали самораспаковывающийся архив, ваш антивирус может отреагировать предупреждением. Это ложное срабатывание на sfx архив 7z, но если вы сомневаетесь, используйте обычный ZIP-архив. ➡️Скачать FLUX.1 dev NF4 Quantized Portable EXE - самораспаковывающийся архив 7z ➡️Скачать FLUX.1 dev NF4 Quantized Portable ZIP - обычный ZIP архив 💬Обсудить в чате | ⭐️Поддержать канал 👾НЕЙРО-СОФТ - Делаем нейросети доступнее.

🎵 Foundation Music Lab ● Генератор музыкальных лупов с мультитрековым редактором ● RU ● by NerualDreming Ссылка на модель:https://huggingface.co/RoyalCities/Foundation-1 Ссылка на GitHub:https://github.com/timoncool/Foundation-Music-Lab Автор: #NerualDreming Дата обновления: 22 марта 2026 Версия: 1.0 Категории:#AIaudio, #txt2audio, #musicgen Платформа:#Windows Язык: RU Место на диске: 10 ГБ Системные требования: NVIDIA GPU 8gb Совместимость: #Nvidia 🖥Описание софта Foundation Music Lab — это генератор музыкальных сэмплов и лупов нового поколения на базе модели Foundation-1. В отличие от обычных генераторов музыки, эта модель заточена именно под продакшн — она генерирует гармонически выверенные лупы, строго привязанные к темпу, тональности и количеству тактов. Это не рандомные звуки от нейросети, а настоящий музыкальный материал, с которым можно работать. Я не просто сделал русскоязычную и портативную версию, как обычно. Я буквально написал мультитрековый редактор, чтобы вы могли генерировать лупы и сразу собирать из них музыку, не отходя от кассы. Это быстро, просто и очень приятно. Пожалуй, это один из первых генераторов такого типа — он генерирует строго гармоничные лупы в тех настройках, которые вы выбрали. И вся музыка складывается в единый трек, если вы генерируете в одной тональности. К тому же генерирует .mid файлы, которые можно импортировать в DAW. 😬Основные возможности Foundation Music Lab: 🟣 Генерация музыкальных лупов с привязкой к BPM и тональности 🟣 Поддержка всех 24 тональностей (мажор и минор) 🟣 Настройка инструментов, тембра и эффектов через текстовые промпты 🟣 Генерация идеальных петель в заданном количестве тактов (4/8 баров) 🟣 Встроенный мультитрековый редактор — собирай треки прямо в приложении 🟣 Экспорт .mid файлов для импорта в DAW 🟣 Полностью русифицированный интерфейс 🟣 Широкая библиотека инструментов: синтезаторы, клавишные, басы, струнные, духовые, гитары, вокальные текстуры и многое другое 🟣 Поддержка эффектов: реверб, дилей, дисторшн, фейзер и другие 💿Установка и запуск ⁍ Скачайте zip архив Foundation Music Lab или архив с окружением ⁍ Распакуйте архив в удобное место (без кириллицы и пробелов в пути) ⁍ Запустите файл install.bat, (или run.bat, для архива с окружением) ⁍ Дождитесь окончания установки (будет выведено соответствующее сообщение) ⁍ Запустите run.bat для начала работы ➡️Скачать Foundation Music Lab installer — обычный ZIP архив с установщиком, все скачает сам ➡️Скачать Foundation Music Lab env — готовое окружение под 4090 и Win 11, скачает только модели 💬Обсудить в нашем чате 👾НЕЙРО-СОФТ - делаем нейросети доступнее

🎵 MMAudio ● Генерация синхронизированного закадрового аудио из видео, изображений и текста ● RU ● Portable by NerualDreming Ссылка на оригинальный GitHub: https://github.com/hkchengrex/MMAudio Репакер: #NerualDreming Дата обновления: 5 января 2025 Версия: 1.0 Категории:#AIaudio, #video2audio, #txt2audio Платформа:#Windows Язык: RU Место на диске: 12 ГБ Системные требования: NVIDIA GPU 8gb Совместимость: #Nvidia 🖥Описание софта: MMAudio - это инновационный инструмент для генерации синхронизированного звука на основе видео, изображений или текста. Особенность системы в том, что она не просто генерирует звук, а создает его в полной синхронизации с происходящим на экране, что делает его незаменимым для создателей контента и видеомонтажеров. 😬Основные возможности MMAudio: 🟣 Генерация аудио из видео с точной синхронизацией 🟣 Создание звука по текстовому описанию 🟣 Преобразование изображений в звуковое сопровождение 🟣 Генерация окружающих звуков и эффектов 🟣 Создание фоновой музыки и атмосферы 🟣 Имитация речи (в виде стилизованной тарабарщины) 🟣 Возможность сохранения аудио отдельно от видео 🟣 Русифицированный интерфейс для удобства использования 💿Установка и запуск: ⁍ Скачайте zip архив MMAudio ⁍ Распакуйте архив в удобное место (без кириллицы в путях) ⁍ Запустите файл install_mmaudio.bat ⁍ После автоматической загрузки всех компонентов и моделей интерфейс приложения откроется в браузере ⁍ Загрузка и установка займет некоторое время и зависит от скорости вашего интернет соеденения, всего будет скачено около 15gb. ➡️Скачать MMAudio Portable Installer ZIP — установщик обычный ZIP архив ➡️Скачать MMAudio Portable Full 7z — Полный архив с моделью и окружением 💬Обсудить в чате | ⭐️Поддержать канал 👾НЕЙРО-СОФТ — делаем нейросети доступнее.

🎧HunyuanVideo-Foley ● Генерация звука для видео ● RU ● Portable by NerualDreming Ссылка на оригинальный GitHub: https://github.com/Tencent-Hunyuan/HunyuanVideo-Foley Репакер:#NerualDreming Дата обновления: 21 сентября 2025 Версия: 1.0 Категории:#AIaudio, #video2audio, #sfx Платформа:#Windows Язык: RU Место на диске: 19 ГБ Системные требования: NVIDIA GPU с VRAM >= 20 ГБ (рекомендуется 24 ГБ, например, RTX 3090/4090) Совместимость:#Nvidia 🖥Описание софта HunyuanVideo-Foley — это передовая модель для озвучивания видео. Инструмент способен генерировать звуковое сопровождение как на основе текстового описания (промпта), так и полностью автоматически, анализируя видеоряд. Гибкие настройки, включая негативные промпты, позволяют тонко контролировать результат, а встроенные функции, такие как подрезка видео и экспорт аудио в нескольких форматах, делают его универсальным решением для видеомонтажеров и создателей контента. 😬 Основные возможности HunyuanVideo-Foley: 🟣 Универсальная генерация звука: Создает аудио как по текстовому промпту, так и без него, анализируя видео. 🟣 Тонкая настройка: Используйте негативные промпты для исключения нежелательных звуков и улучшения качества. 🟣 Вариативность: Возможность генерировать несколько вариантов озвучки для одного видео. 🟣 Встроенный редактор: Функция подрезки видео прямо в интерфейсе для работы с нужными фрагментами. 🟣 Экспорт аудио: Сохранение сгенерированной аудиодорожки в трех популярных форматах. 💬 Видео длиной менее 3 секунд могут вызывать ошибку при обработке. 💿Установка и запуск: ⁍ Скачайте один из архивов: с установщиком или с готовым окружением. Оба варианта скачивают модели автоматически при первом запуске. ⁍ Распакуйте архив в удобное место (без кириллицы и пробелов в пути). ⁍ Если скачали установщик: запустите файл install.bat и дождитесь окончания установки. ⁍ Если скачали готовое окружение: запустите файл run_app.bat. ⁍ После загрузки компонентов интерфейс приложения откроется в вашем браузере. ➡️Скачать HunyuanVideo-Foley (Установщик) - скачает сам все необходимые компоненты. ➡️Скачать HunyuanVideo-Foley (Готовое окружение) - архив с готовой средой, скачивает только модели. 💬Обсудить в чате | ⭐️Поддержать канал 👾НЕЙРО-СОФТ — Делаем нейросети доступнее.

🎭Fish Speech Dialogue DLC ● Система для озвучивания диалогов различными голосами ● RU ● by NerualDreming Ссылка на Fish Speech MOD: https://t.me/neuroport/134 Репакер:#NerualDreming Дата обновления: 15 февраля 2025 Версия: 0.06 Категории:#TTS, #voiceclone, #AIaudio, #dialogue Платформа:#Windows Язык: RU Место на диске: 10kb Системные требования: NVIDIA GPU 8GB Совместимость:#Nvidia 🖥Описание софта: Fish Speech Dialogue — это мощное дополнение на базе Fish Speech MOD, разработанное для генерации озвучки целых диалогов с использованием различных голосов. Этот инструмент позволяет автоматически распознавать и назначать голоса говорящим в диалоге, что делает процесс создания озвучки быстрым и удобным. Это мой первый эксперимент такого рода на базе одного приложения, создано другое. Это не отдельное приложение, это дополнение которое устанавливается в папку к уже существующему Fish Speech MOD. 😬Основные возможности Fish Speech Dialogue: 🟣Автоматическое распределение голосов: Просто вставьте текст диалога, в формате Говорящий 1: и система автоматически определит говорящих и назначит им случайные голоса. 🟣Поддержка до 10 говорящих: Создавайте сложные диалоги с большим количеством участников (хотя автор не тестировал так много говорящих, поэтому возможны некоторые ограничения). 🟣Гибкая настройка голосов: Использует ту же базу голосов, что и Fish Speech MOD из папки examples. Все готово сразу после установки. Дополнительные голоса. 🟣Форматы сохранения: Сохраняйте результаты в форматах WAV, MP3 и FLAC. 🟣Расширенные настройки: Настройте параметры генерации, такие как длина промпта, максимальное количество токенов, температура и штраф за повторение. 💿Установка и запуск: ⁍ Скачайте zip архив Fish Speech Dialogue. ⁍ Распакуйте архив в ту же директорию, где находится Fish Speech MOD. ⁍ Запустите файл start_dialogue.bat. ⁍ После загрузки компонентов интерфейс приложения откроется в браузере. ➡️Скачать Fish Speech Dialogue ZIP — обычный ZIP архив 💬Обсудить в чате | ⭐️Поддержать канал 👾НЕЙРО-СОФТ — Делаем нейросети доступнее.

🎙 VibeVoice Подкастер PRO ● Лучший генератор речи по образцу голоса ● RU ● Portable by NerualDreming Ссылка на GitHub(форк):https://github.com/rsxdalv/VibeVoice Репакер:#NerualDreming Дата обновления: 1 сентября 2025 Версия: 1.1 Категории:#TTS, #voiceclone, #AIaudio, #podcast Платформа:#Windows Язык: RU Место на диске: до 40 ГБ (включая все три модели) Системные требования: NVIDIA GPU 8/16/24 ГБ VRAM Совместимость:#Nvidia 🖥Описание софта VibeVoice — это легендарный инструмент для генерации речи, который задал новую планку качества в клонировании голоса. Технология оказалась настолько совершенной, что Microsoft удалила код и модели через сутки после публикации из-за опасений злоупотреблений. Мы нашли оригинальную большую модель и собрали для неё удобный и функциональный интерфейс. Это незаменимый инструмент для создателей контента, разработчиков игр, рекламщиков и всех, кто работает со звуком. Модель идеально передает тончайшие нюансы голоса, интонации и эмоциональную окраску, делая синтезированную речь практически неотличимой от настоящей. В комплекте — 50 готовых голосов от нашего сообщества. 😬Основные возможности VibeVoice Подкастер PRO 🟣 Отличная поддержка русского языка: Модель прекрасно понимает и генерирует русскую речь, сохраняя естественность и правильные интонации. 🟣 Три модели на выбор для разных GPU: • VibeVoice-1.5B: требует 8 ГБ VRAM (генерирует аудио до 90 минут) • VibeVoice-7B: требует 16 ГБ VRAM (промежуточная модель) • VibeVoice-Large: требует 24 ГБ VRAM (генерирует аудио до 45 минут) 🟣 Генерация длинных аудио: Создавайте целые подкасты или аудиокниги длиной до 90 минут за один раз. (мы не проверяли) 🟣 Мульти-голосовая генерация: Поддержка до 4 разных дикторов в одном аудиофайле с естественными переходами. 🟣 Естественная подача и эмоции: Модель превосходно улавливает контекст, ставит правильные ударения и управляет эмоциональной окраской речи. 🟣 Тонкая настройка: Доступ к расширенным параметрам для полного контроля над процессом генерации. 🟣 Гибкость форматов: Сохранение результата в трех популярных аудиоформатах на выбор. 🟣 Готовая библиотека голосов: 50 тщательно отобранных голосов доступны сразу после установки, еще больше — в нашем чате. 🟣 Удобный интерфейс: Полностью русифицированный интерфейс с возможностью прослушивания и загрузки своих образцов голоса. ⚠️Известныепроблемы:В зависимости от контекста, VibeVoice может самопроизвольно генерировать звуковые эффекты, такие как фоновая музыка, аплодисменты или закадровый смех. Это не баг, а фича. Если шаги генерации не идут - перезапустите bat. Это может быть связано с слишком длинными образцами голоса, попробуйте использовать не больше 12 секунд - обрезать можно прямо в интерфейсе. 💿Установка и запуск: Примечание: Модели (1.5B, 7B, Large) не скачиваются сразу. Загрузка нужной модели начнется автоматически при первой попытке генерации. Для версии Installer (ZIP): ⁍ Скачайте ZIP-архив. ⁍ Распакуйте его в удобное место (путь без кириллицы и пробелов). ⁍ Запустите файл install.bat для установки окружения. ⁍ После завершения установки, для работы используйте run_demo.bat. Для версии ENV (7z): ⁍ Скачайте 7z-архив. ⁍ Распакуйте его в удобное место. ⁍ Для работы сразу запустите файл run_demo.bat. ➡️ Скачать архиватор 7z ➡️Скачать VibeVoice PRO Portable Installer (ZIP) — ZIP-архив с полным установщиком (скачает окружение). ➡️Скачать VibeVoice PRO Portable ENV (7z)— обычный 7z-архив с готовым окружением (модели скачиваются при первом использовании). 💬Обсудить в чате | ⭐️Поддержать канал 👾НЕЙРО-СОФТ — Делаем нейросети доступнее.

🎙Vikhr Borealis ● Speech-to-Text ●Транскрипция русской речи в текст ● Portable by NerualDreming Ссылка на оригинальный релиз: https://huggingface.co/Vikhrmodels/Borealis Репакер:#NerualDreming Дата обновления: 25 сентября 2025 Версия: 1.0 Категории:#stt, #speechtotext, #audiollm Платформа:#Windows Место на диске: 20 ГБ Системные требования: NVIDIA GPU с не менее 6 ГБ VRAM Совместимость:#Nvidia 🖥Описание софта Borealis - это первая audio llm c ASR для русского языка от команды Vikhr. Важным отличием от других моделей является поддержка пунктуации в распознанных аудио. По замерам команды Vikhr, Borealis показывает меньшее количество ошибок и лучше соблюдает пунктуацию по сравнению с Whisper. В этой портативной сборке я сделал удобную оболочку, в которую можно загрузить как аудио, так и видео и легко превратить речь в текст. Давайте поддержим отечественного производителя! 😬 Основные возможности Vikhr Borealis: 🟣 Распознавание речи в текст для русского языка 🟣 Корректная расстановка знаков препинания 🟣 Более низкое количество ошибок по сравнению с аналогами 🟣 Возможность обработки как аудио, так и видео файлов 🟣 Удобный и простой в использовании интерфейс 💿Установка и запуск: ⁍ Скачайте Установщик или готовое Окружение. ⁍ Распакуйте архив в удобное место (без кириллицы и пробелов в пути). ⁍ Если скачали установщик, запустите файл install.bat и дождитесь окончания установки. ⁍ Для запуска программы используйте файл run_demo.bat. ⁍ Интерфейс приложения автоматически откроется в вашем браузере. ➡️Скачать Vikhr Borealis Portable (Установщик) - сам скачает и установит все необходимые компоненты. ➡️Скачать Vikhr Borealis Portable (Готовое окружение) - архив со всеми компонентами - скачает модели после запуска. 💬Обсудить в чате | ⭐️Поддержать канал 👾НЕЙРО-СОФТ — Делаем нейросети доступнее.

👄 LatentSync ● Синхронизация движения губ с аудио ● RU ● Portable by NerualDreming Ссылка на оригинальный GitHub:https://github.com/bytedance/LatentSync Репакер:#NerualDreming Дата обновления: 11 января 2025 Версия: 1.0 Категории:#lipsync, #AIvideo, #video2video Платформа:#Windows Язык: RU Место на диске: 17 ГБ Системные требования: NVIDIA GPU с не менее 8 ГБ VRAM Совместимость:#Nvidia 🖥Описание софта: LatentSync - это инновационный инструмент для синхронизации движения губ с аудио на основе латентных диффузионных моделей. Особенность системы в том, что она создает естественную и точную синхронизацию губ с речью без промежуточных этапов обработки, что делает результат более качественным и реалистичным. 😬Основные возможности LatentSync: 🟣 Высокоточная синхронизация движения губ с аудио 🟣 Сохранение естественной мимики лица 🟣 Поддержка как реальных, так и анимированных видео 🟣 Простой и понятный интерфейс 💿Установка и запуск: ⁍ Скачайте zip архив LatentSync ⁍ Распакуйте архив в удобное место (без кириллицы и пробелов в пути) ⁍ Запустите файл install-script.bat ⁍ Дождитесь окончания установки (будет выведено соответствующее сообщение) ⁍ Запустите start_latentsync.bat для начала работы ➡️Скачать LatentSync Portable ZIP — обычный ZIP архив 💬Обсудить в чате | ⭐️Поддержать канал 👾НЕЙРО-СОФТ — Делаем нейросети доступнее.

🎙 VoxCPM2 Portable ● Синтез и клонирование голоса + авто-обучение LoRA одним кликом ● RU ● by NerualDreming Ссылка на GitHub:https://github.com/timoncool/VoxCPM2_portable Автор:#NerualDreming Дата обновления: 19 апреля 2026 Версия: 1.0 Категории: #AIaudio, #TTS, #voicecloning, #LoRA Платформа:#Windows Язык: RU, EN Место на диске: 20 ГБ Системные требования: NVIDIA GPU 8+ ГБ VRAM, 16+ ГБ RAM Совместимость:#Nvidia#CPU 🖥Описание софта VoxCPM2 Portable — это портативная сборка open-source модели VoxCPM2 от OpenBMB (2 миллиарда параметров, 2 миллиона часов обучающей речи) с русскоязычной Gradio-студией. Делает три вещи: синтез речи на 30 языках с автоопределением, Voice Design (новый голос из текстового описания без референса) и клонирование голоса по короткому референсу. Выход — студийные 48 kHz через AudioVAE V2 super-resolution. Есть live-стриминг — аудио начинает играть во время генерации, не надо ждать окончания синтеза. И вот что главное — это очень мощная система для клонирования голоса, работает быстро, качество отличное. Как киллер-фича — можно обучить LoRA на любом голосе. Я решил развить эту идею и сделал автоматический пайплайн для подготовки датасета. Всё что вам надо — закинуть видео или аудио, а дальше умный пайплайн сам нарежет его на голосовые клипы, скачает ASR-модель, сделает транскрипцию и подготовит клипы для обучения LoRA. Вам буквально надо нажать одну кнопку, чуть подождать — и вот лучшее из open-source качество синтеза голоса уже у вас. 😬Основные возможности VoxCPM2 Portable: 🟣 Синтез речи на 30 языках с автоопределением, 48 kHz студийное качество через AudioVAE V2 🟣 Voice Design — создание голосов из текстового описания (пол, возраст, эмоция, акцент), zero-shot 🟣 Voice Cloning — клонирование по 5-50 секундам референса, с опциональным Ultimate-режимом 🟣 Живое стриминг-воспроизведение: аудио начинает играть во время генерации, не надо ждать 🟣 Пак из 100+ готовых голосов + 743 русских голоса по запросу из Slait/russia_voices 🟣 Контроль стиля: «чуть быстрее, бодрым тоном», «шёпотом, интимно», «медленно и драматично» 🟣 Форматы вывода MP3 / WAV / FLAC / OGG 🟣 Авто-обучение LoRA из видео: ffmpeg → Parakeet TDT 0.6B v3 INT8 (NVIDIA NeMo, 25 европейских языков) + Silero VAD → нарезка по предложениям → авто-подбор параметров → запуск тренировки. Одна кнопка 🟣 Ручной режим тренировки LoRA для заранее подготовленных датасетов 🟣 Hot-swap LoRA — переключение между моделями без перезапуска приложения 🟣 ZipEnhancer денойзер для шумных референсов 🟣 Все параметры модели в UI: CFG, Inference Steps, Min/Max длина, Retry, Seed 🟣 Flash Attention 2 из коробки (RTX 40xx / 50xx), xformers, Triton, bfloat16 🟣 i18n RU/EN с переключением в шапке, тёмная тема, FFmpeg в комплекте 💿Установка и запуск ⁍ Скачайте архив с установщиком или клонируйте репозиторий ⁍ Запустите install.bat — выберите поколение вашей видеокарты ⁍ Установщик сам скачает Python 3.12, PyTorch, voxcpm, Flash Attention 2, FFmpeg ⁍ Запустите run.bat — приложение откроется в браузере ⁍ Модели подтянутся при первом запуске (VoxCPM2 ~4-5 ГБ; Parakeet ASR ~670 МБ — лениво при первом клике на авто-подготовку) ⁍ Используйте update.bat для обновлений ⭐️Поставить звезду на GitHub — вам не сложно, а другим будет проще найти проект ➡️Скачать Portable установщик — скачает всё что нужно ➡️Скачать Portable env win11 rtx4090 — окружение под Win 11 и RTX 4090 ➡️Установка в 1 клик через Pinokio — сначала нужно скачать сам установщик Pinokio 💬Обсудить в нашем чате 👾НЕЙРО-СОФТ - делаем нейросети доступнее

✍️ JoyCaption Ultimate α2 (2024-09-26) ● Генератор описаний и тегов для изображений с режимом пакетной обработки ● RU ● by NerualDreming & Slait Ссылка на оригинальный GitHub:https://github.com/fpgaminer/joycaption Репакеры: #NerualDreming, #Slait Дата обновления модели: 26 сентября 2024 Версия: α2 Категории:#captioning, #AIvision, #img2txt Платформа:#Windows Язык: RU Место на диске: 20 ГБ Системные требования: NVIDIA GPU 12gb VRAM Совместимость:#Nvidia 🖥Описание софта: JoyCaption — инструмент для генерации подробных описаний изображений в различных стилях и форматах. Незаменим для создания описаний изображений при подготовке тренировочных датасетов. Полезен для получения промптов из любых изображений. Адекватно работает с NSFW-концепциями и тегами. В этой русифицированной модифицированной сборке добавлена поддержка пакетной обработки файлов, сохранение обработанных изображений в директорию проекта, перевод интерфейса и многое другое для удобства работы. Всё работает локально, используя квантованную модель nf4 для экономии ресурсов и увеличения скорости обработки. 😬 Основные возможности JoyCaption α2: 🟣9 режимов генерации (описание, SD-промпты, MidJourney, booru-теги, соцсети и др.) 🟣Расширенные инструкции: имя персонажа, свет, композиция, глубина, качество 🟣Формальный и неформальный стиль 🟣Выбор длины описания 🟣Поддержка пользовательских промптов 🟣Сохранение промптов и изображений в отдельную папку 🟣Возможность визуально проверить и исправить вручную неудачные промпты в пакетном режиме, с повторным сохранением по одному, или всех сразу 🟣Переведённый UI и простой запуск 💿Установка и запуск: ⁍ Скачайте 7z архив JoyCaption с установщиком или с окружением ⁍ Разархивируйте с помощью 7-Zip ⁍ Распакуйте архив в удобное место (без кириллицы и пробелов в пути) ⁍ Запустите файл installer.bat если скачали установщик ⁍ Запустите файл start_joy_caption.bat если скачали версию с готовым окружением ⁍ После загрузки моделей интерфейс откроется в браузере ➡️ Скачать архиватор 7z ➡️joy_caption_ultimate_portable_installer.7z — установщик, всё скачает сам ➡️joy_caption_ultimate_portable_environment.7z — готовое окружение, скачиваются только модели 💬Обсудить в чате | ⭐️Поддержать канал 👾НЕЙРО-СОФТ — Делаем нейросети доступнее.

12
上一页第 1/2 页下一页