TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #62 · 4 апр.

Когда разрабатываете свой GUI с помощью PyQt для какого-либо софта бывает необходимо позаимствовать цвета из текущего стиля интерфейса. Например, чтобы правильно раскрасить свои виджеты, подогнав их по цвету. Ведь бывает, что ваш GUI используется в разных софтах. Причём некоторые со светлой темой а другие с тёмной. По умолчанию стили наследуются, но если вы задаёте какую-либо раскраску для части виджета через свой styleSheet, то требуется ссылаться на цвета текущего стиля. Как это сделать? Как получить нужный цвет из палитры имеющегося стиля? Это достаточно просто, нужно использовать класс QPalette и его роли. Например, мне нужно достать цвет текста из одного виджета и применить его в другом как цвет фона (не важно зачем именно так, просто захотелось😊). Получаем палитру виджета и сразу достаём нужный цвет, указав его роль. from PySide2.QtGui import QPalette color = main_window.palette().color(QPalette.Text) теперь можем использовать этот цвет в стилях my_widget.setStyleSheet(f'background-color: {color.name()};') Готово, мы динамически переопределили дефолтный стиль используя текущий стиль окна! На самом деле есть запись покороче, в одну строку и без лишних переменных. Не очень-то по правилам CSS, но Qt это понимает. my_widget.setStyleSheet('background-color: palette(Text);') Этот способ не подходит если вам нужно как-то модифицировать цвет перед применением в своих стилях. В этом случае потребуется первый способ. Зато он прекрасно сработает в файле .qss, то есть не придётся в коде прописывать раскраску отдельных элементов через ссылки на палитру, всё красиво сохранится в отдельном файле .qss! QListView#my_widget::item:selected { background: palette(Midlight); } Про имеющиеся роли можно почитать здесь🌍 #qt#tricks

Hashtags

Резултати

Пронајдени 17 слични објави

Пребарај: #nerualdreming

当前筛选 #nerualdreming清除筛选

🐟 Fish OpenAudio S1 Mini ● Синтез речи и клонирование голоса ● RU+EN ● Portable by Nerual Dreming Ссылка на оригинальный релиз:https://huggingface.co/spaces/fishaudio/openaudio-s1-mini Репакер:#NerualDreming Дата обновления: 15 июня 2025 Версия: 1.0 Категории:#TTS, #voicecloning, #AIaudio Платформа:#Windows Язык: RU, EN Место на диске: 11 ГБ Системные требования: NVIDIA GPU с не менее 6 ГБ VRAM Совместимость:#Nvidia 🖥Описание софта: OpenAudio S1 Mini — это значительный шаг вперед по сравнению с ее предшественницей, Fish Speech 1.5. Главное преимущество модели — превосходная выразительность и естественность звучания, которые достигаются за счет совершенного управления эмоциональными оттенками с помощью специальных маркеров. Будучи «дистиллированной» версией более крупной модели, она предлагает передовые возможности в значительно более легком и ресурсоэффективном пакете, что делает ее доступной для широкого круга пользователей. 😬 Основные возможности OpenAudio S1 Mini: 🟣 Превосходная выразительность: Управляйте эмоциями и тоном с помощью более 50 маркеров. 🟣 Высокое качество звука: Благодаря обучению с подкреплением на основе отзывов человека (RLHF), модель генерирует более естественное и приятное звучание. 🟣 Клонирование голоса: Возможность клонировать любой голос по короткому аудиофрагменту (10-30 секунд). 🟣 Встроенная библиотека голосов: Пак из более чем 50 готовых русскоязычных и англоязычных голосов. 🟣 Оптимизация для русского языка: Настройки по умолчанию адаптированы для качественного синтеза русской речи. 🟣 Эффективность: Легковесная модель (0.5 млрд параметров) потребляет меньше ресурсов, чем ее предшественники. 🟣 Высокие позиции в бенчмарках TTS-Arena. 💡 Как использовать маркеры эмоций: Для управления интонацией просто добавьте нужный маркер в скобках в ту часть текста, где должна измениться эмоция. Модель поймет эту команду и сгенерирует речь с соответствующим оттенком. Эмоциональные маркеры: (angry) (sad) (disdainful) (excited) (surprised) (satisfied) (unhappy) (anxious) (hysterical) (delighted) (scared) (worried) (indifferent) (upset) (impatient) (nervous) (guilty) (scornful) (frustrated) (depressed) (panicked) (furious) (empathetic) (embarrassed) (reluctant) (disgusted) (keen) (moved) (proud) (relaxed) (grateful) (confident) (interested) (curious) (confused) (joyful) (disapproving) (negative) (denying) (astonished) (serious) (sarcastic) (conciliative) (comforting) (sincere) (sneering) (hesitating) (yielding) (painful) (awkward) (amused) Тональные маркеры: (in a hurry tone) (shouting) (screaming) (whispering) (soft tone) Специальные маркеры: (laughing) (chuckling) (sobbing) (crying loudly) (sighing) (panting) (groaning) (crowd laughing) (background laughter) (audience laughing) ⚠️По моему мнению для русского языка не подходит! Коверкает ударения, но попробуйте на других языках. Модель поддерживает: English (en), Chinese (zh), Japanese (ja), German (de), French (fr), Spanish (es), Korean (ko), Arabic (ar), Russian (ru), Dutch (nl), Italian (it), Polish (pl), Portuguese (pt) 💿Установка и запуск: ⁍ Скачайте полный 7z-архив с моделями и окружением. ⁍ Распакуйте архив в удобное место с помощью 7-Zip. ⁍ Для запуска русской версии запустите файл run_ru.bat. ⁍ Для запуска английской версии запустите файл run_en.bat. ⁍ Интерфейс приложения автоматически откроется в вашем браузере. ➡️ Скачать архиватор 7z ➡️Скачать OpenAudio S1 Mini Portable — полный архив 7z с окружением и моделью 💬Обсудить в чате | ⭐️Поддержать канал 👾НЕЙРО-СОФТ — Делаем нейросети доступнее.

🐠 Fish Speech MOD ● Модифицированная версия синтезатора речи с клонированием голоса ● RU ● Portable by NerualDreming Ссылка на оригинальный GitHub:https://github.com/fishaudio/fish-speech Репакер:#NerualDreming Дата обновления: 15 января 2025 Версия: 1.4.3 Категории:#TTS, #voiceclone, #AIaudio Платформа:#Windows Язык: RU Место на диске: 10 ГБ Системные требования: NVIDIA GPU 8gb Совместимость:#Nvidia 🖥Описание софта: Fish Speech - это мощный инструмент для синтеза речи с возможностью клонирования голоса. Особенность данной модифицированной версии в том, что она адаптирована для русскоязычных пользователей и дополнена новыми функциями для более удобной работы. 😬Основные возможности Fish Speech: 🟣 Клонирование голоса по образцу 15-60 секунд 🟣 Поддержка русского и других языков (английский, японский, корейский, китайский, французский, немецкий, арабский, испанский) 🟣 Высокая точность синтеза речи 🟣 Сохранение в форматах MP3 и FLAC 🟣 Полностью русифицированный интерфейс 🟣 Упрощенная работа с папкой examples - достаточно добавить MP3 и текстовый файл с расшифровкой для добавления новых голосов 🟣 Оптимизированный интерфейс без неиспользуемых элементов 📣Встроенные голоса: 🔘 Крастер (YouTube) 🔘 Губка Боб 🔘 Тинькофф (YouTube) 🔘 Кропина (YouTube, женский) 🔘 Бухмин (AudioBook) 🔘 Володарский 🔘 Гоблин Пучков (YouTube) 🔘 Дедпул (Гланц) 🔘 Денис Колесников (YouTube) 🔘 5 дополнительных женских голосов на английском языке ⚠️Отказ от ответственности: Все примеры голосов взяты из открытых источников и представлены с уважением к их носителям и исключительно в демонстрационных целях. Для коммерческого использования рекомендуем обращаться к авторам. Несанкционированное использование чужих голосов в коммерческих целях и без разрешений не только нарушает права их владельцев, но и может преследоваться по закону. Мы категорически запрещаем и осуждаем использование данной технологии для нарушения чьих-либо прав или для совершения противоправных действий! 💿Установка и запуск: ⁍ Скачайте zip архив Fish Speech ⁍ Распакуйте архив в удобное место ⁍ Запустите файл install.bat ⁍ Дождитесь окончания установки (будет выведено соответствующее сообщение) ⁍ Запустите start.bat для начала работы ➡️Скачать Fish Speech Mod Portable ZIP — обычный ZIP архив 💬Обсудить в чате | ⭐️Поддержать канал 👾НЕЙРО-СОФТ — Делаем нейросети доступнее.

👏FLUX.1 dev NF4 Quantized ● Лучшая модель для генерации изображений ● RU ● Portable by Nerual Dreming Ссылка на оригинальный релиз:https://huggingface.co/black-forest-labs/FLUX.1-dev Репакер:#NerualDreming Дата обновления: 10 августа 2024 Версия: 1.0 Категории:#txt2img, #img2img, #AIart Платформа:#Windows Язык: RU Место на диске: 38 ГБ Системные требования: NVIDIA GPU с не менее 16 ГБ VRAM, 32 ГБ RAM Совместимость:#Nvidia Лицензия:Некоммерческая лицензия 🖥Описание софта: FLUX.1 dev - это мощная модель генерации изображений по текстовому описанию, основанная на 12-миллиардном трансформере с выпрямленным потоком. Эта дистиллированная квантованная версия позволяет запускать модель на бытовых видеокартах, сохраняя высокое качество генерации. 😬 Основные возможности FLUX.1 dev NF4 Quantized: 🔘 Высочайшее качество генерации, уступающее только FLUX.1 pro 🔘 Отличное следование промпту, сравнимое с закрытыми аналогами такими как DALL-E 3, Midjourney, Ideogram 🔘 Повышенная эффективность и скорость генерации благодаря дистилляции 🔘Невероятное качество генерации текста на изображениях 🔘 Открытая модель для научных исследований и творческих экспериментов 🔘 Поддержка различных соотношений сторон и разрешений 🔘 Добавлена поддержка img2img 🔘 Возможность настройки количества шагов генерации ⚠️Важно: Генерация на видеокартах с объемом памяти менее 24 ГБ может занимать значительное время. На RTX 4090 генерация занимает всего 16 секунд. 💿Установка и запуск: ⁍ Скачайте самораспаковывающийся архив Flux1-dev-nf4-neuroport.exe или одноименный ZIP-архив. ⁍ Если вы скачали EXE, запустите его и выберите папку для распаковки. Если ZIP, распакуйте его в удобное место. ⁍ После распаковки запустите файл start_flux_portable.bat. ⁍ Дождитесь загрузки компонентов, после чего интерфейс откроется в браузере. ⁍ Чтобы включить темную тему, добавьте в конце URL адреса /?__theme=dark ⚠️Примечание: Если вы выбрали самораспаковывающийся архив, ваш антивирус может отреагировать предупреждением. Это ложное срабатывание на sfx архив 7z, но если вы сомневаетесь, используйте обычный ZIP-архив. ➡️Скачать FLUX.1 dev NF4 Quantized Portable EXE - самораспаковывающийся архив 7z ➡️Скачать FLUX.1 dev NF4 Quantized Portable ZIP - обычный ZIP архив 💬Обсудить в чате | ⭐️Поддержать канал 👾НЕЙРО-СОФТ - Делаем нейросети доступнее.

🎵 Foundation Music Lab ● Генератор музыкальных лупов с мультитрековым редактором ● RU ● by NerualDreming Ссылка на модель:https://huggingface.co/RoyalCities/Foundation-1 Ссылка на GitHub:https://github.com/timoncool/Foundation-Music-Lab Автор: #NerualDreming Дата обновления: 22 марта 2026 Версия: 1.0 Категории:#AIaudio, #txt2audio, #musicgen Платформа:#Windows Язык: RU Место на диске: 10 ГБ Системные требования: NVIDIA GPU 8gb Совместимость: #Nvidia 🖥Описание софта Foundation Music Lab — это генератор музыкальных сэмплов и лупов нового поколения на базе модели Foundation-1. В отличие от обычных генераторов музыки, эта модель заточена именно под продакшн — она генерирует гармонически выверенные лупы, строго привязанные к темпу, тональности и количеству тактов. Это не рандомные звуки от нейросети, а настоящий музыкальный материал, с которым можно работать. Я не просто сделал русскоязычную и портативную версию, как обычно. Я буквально написал мультитрековый редактор, чтобы вы могли генерировать лупы и сразу собирать из них музыку, не отходя от кассы. Это быстро, просто и очень приятно. Пожалуй, это один из первых генераторов такого типа — он генерирует строго гармоничные лупы в тех настройках, которые вы выбрали. И вся музыка складывается в единый трек, если вы генерируете в одной тональности. К тому же генерирует .mid файлы, которые можно импортировать в DAW. 😬Основные возможности Foundation Music Lab: 🟣 Генерация музыкальных лупов с привязкой к BPM и тональности 🟣 Поддержка всех 24 тональностей (мажор и минор) 🟣 Настройка инструментов, тембра и эффектов через текстовые промпты 🟣 Генерация идеальных петель в заданном количестве тактов (4/8 баров) 🟣 Встроенный мультитрековый редактор — собирай треки прямо в приложении 🟣 Экспорт .mid файлов для импорта в DAW 🟣 Полностью русифицированный интерфейс 🟣 Широкая библиотека инструментов: синтезаторы, клавишные, басы, струнные, духовые, гитары, вокальные текстуры и многое другое 🟣 Поддержка эффектов: реверб, дилей, дисторшн, фейзер и другие 💿Установка и запуск ⁍ Скачайте zip архив Foundation Music Lab или архив с окружением ⁍ Распакуйте архив в удобное место (без кириллицы и пробелов в пути) ⁍ Запустите файл install.bat, (или run.bat, для архива с окружением) ⁍ Дождитесь окончания установки (будет выведено соответствующее сообщение) ⁍ Запустите run.bat для начала работы ➡️Скачать Foundation Music Lab installer — обычный ZIP архив с установщиком, все скачает сам ➡️Скачать Foundation Music Lab env — готовое окружение под 4090 и Win 11, скачает только модели 💬Обсудить в нашем чате 👾НЕЙРО-СОФТ - делаем нейросети доступнее

🎵 MMAudio ● Генерация синхронизированного закадрового аудио из видео, изображений и текста ● RU ● Portable by NerualDreming Ссылка на оригинальный GitHub: https://github.com/hkchengrex/MMAudio Репакер: #NerualDreming Дата обновления: 5 января 2025 Версия: 1.0 Категории:#AIaudio, #video2audio, #txt2audio Платформа:#Windows Язык: RU Место на диске: 12 ГБ Системные требования: NVIDIA GPU 8gb Совместимость: #Nvidia 🖥Описание софта: MMAudio - это инновационный инструмент для генерации синхронизированного звука на основе видео, изображений или текста. Особенность системы в том, что она не просто генерирует звук, а создает его в полной синхронизации с происходящим на экране, что делает его незаменимым для создателей контента и видеомонтажеров. 😬Основные возможности MMAudio: 🟣 Генерация аудио из видео с точной синхронизацией 🟣 Создание звука по текстовому описанию 🟣 Преобразование изображений в звуковое сопровождение 🟣 Генерация окружающих звуков и эффектов 🟣 Создание фоновой музыки и атмосферы 🟣 Имитация речи (в виде стилизованной тарабарщины) 🟣 Возможность сохранения аудио отдельно от видео 🟣 Русифицированный интерфейс для удобства использования 💿Установка и запуск: ⁍ Скачайте zip архив MMAudio ⁍ Распакуйте архив в удобное место (без кириллицы в путях) ⁍ Запустите файл install_mmaudio.bat ⁍ После автоматической загрузки всех компонентов и моделей интерфейс приложения откроется в браузере ⁍ Загрузка и установка займет некоторое время и зависит от скорости вашего интернет соеденения, всего будет скачено около 15gb. ➡️Скачать MMAudio Portable Installer ZIP — установщик обычный ZIP архив ➡️Скачать MMAudio Portable Full 7z — Полный архив с моделью и окружением 💬Обсудить в чате | ⭐️Поддержать канал 👾НЕЙРО-СОФТ — делаем нейросети доступнее.

🎧HunyuanVideo-Foley ● Генерация звука для видео ● RU ● Portable by NerualDreming Ссылка на оригинальный GitHub: https://github.com/Tencent-Hunyuan/HunyuanVideo-Foley Репакер:#NerualDreming Дата обновления: 21 сентября 2025 Версия: 1.0 Категории:#AIaudio, #video2audio, #sfx Платформа:#Windows Язык: RU Место на диске: 19 ГБ Системные требования: NVIDIA GPU с VRAM >= 20 ГБ (рекомендуется 24 ГБ, например, RTX 3090/4090) Совместимость:#Nvidia 🖥Описание софта HunyuanVideo-Foley — это передовая модель для озвучивания видео. Инструмент способен генерировать звуковое сопровождение как на основе текстового описания (промпта), так и полностью автоматически, анализируя видеоряд. Гибкие настройки, включая негативные промпты, позволяют тонко контролировать результат, а встроенные функции, такие как подрезка видео и экспорт аудио в нескольких форматах, делают его универсальным решением для видеомонтажеров и создателей контента. 😬 Основные возможности HunyuanVideo-Foley: 🟣 Универсальная генерация звука: Создает аудио как по текстовому промпту, так и без него, анализируя видео. 🟣 Тонкая настройка: Используйте негативные промпты для исключения нежелательных звуков и улучшения качества. 🟣 Вариативность: Возможность генерировать несколько вариантов озвучки для одного видео. 🟣 Встроенный редактор: Функция подрезки видео прямо в интерфейсе для работы с нужными фрагментами. 🟣 Экспорт аудио: Сохранение сгенерированной аудиодорожки в трех популярных форматах. 💬 Видео длиной менее 3 секунд могут вызывать ошибку при обработке. 💿Установка и запуск: ⁍ Скачайте один из архивов: с установщиком или с готовым окружением. Оба варианта скачивают модели автоматически при первом запуске. ⁍ Распакуйте архив в удобное место (без кириллицы и пробелов в пути). ⁍ Если скачали установщик: запустите файл install.bat и дождитесь окончания установки. ⁍ Если скачали готовое окружение: запустите файл run_app.bat. ⁍ После загрузки компонентов интерфейс приложения откроется в вашем браузере. ➡️Скачать HunyuanVideo-Foley (Установщик) - скачает сам все необходимые компоненты. ➡️Скачать HunyuanVideo-Foley (Готовое окружение) - архив с готовой средой, скачивает только модели. 💬Обсудить в чате | ⭐️Поддержать канал 👾НЕЙРО-СОФТ — Делаем нейросети доступнее.

🎭Fish Speech Dialogue DLC ● Система для озвучивания диалогов различными голосами ● RU ● by NerualDreming Ссылка на Fish Speech MOD: https://t.me/neuroport/134 Репакер:#NerualDreming Дата обновления: 15 февраля 2025 Версия: 0.06 Категории:#TTS, #voiceclone, #AIaudio, #dialogue Платформа:#Windows Язык: RU Место на диске: 10kb Системные требования: NVIDIA GPU 8GB Совместимость:#Nvidia 🖥Описание софта: Fish Speech Dialogue — это мощное дополнение на базе Fish Speech MOD, разработанное для генерации озвучки целых диалогов с использованием различных голосов. Этот инструмент позволяет автоматически распознавать и назначать голоса говорящим в диалоге, что делает процесс создания озвучки быстрым и удобным. Это мой первый эксперимент такого рода на базе одного приложения, создано другое. Это не отдельное приложение, это дополнение которое устанавливается в папку к уже существующему Fish Speech MOD. 😬Основные возможности Fish Speech Dialogue: 🟣Автоматическое распределение голосов: Просто вставьте текст диалога, в формате Говорящий 1: и система автоматически определит говорящих и назначит им случайные голоса. 🟣Поддержка до 10 говорящих: Создавайте сложные диалоги с большим количеством участников (хотя автор не тестировал так много говорящих, поэтому возможны некоторые ограничения). 🟣Гибкая настройка голосов: Использует ту же базу голосов, что и Fish Speech MOD из папки examples. Все готово сразу после установки. Дополнительные голоса. 🟣Форматы сохранения: Сохраняйте результаты в форматах WAV, MP3 и FLAC. 🟣Расширенные настройки: Настройте параметры генерации, такие как длина промпта, максимальное количество токенов, температура и штраф за повторение. 💿Установка и запуск: ⁍ Скачайте zip архив Fish Speech Dialogue. ⁍ Распакуйте архив в ту же директорию, где находится Fish Speech MOD. ⁍ Запустите файл start_dialogue.bat. ⁍ После загрузки компонентов интерфейс приложения откроется в браузере. ➡️Скачать Fish Speech Dialogue ZIP — обычный ZIP архив 💬Обсудить в чате | ⭐️Поддержать канал 👾НЕЙРО-СОФТ — Делаем нейросети доступнее.

🎙 VibeVoice Подкастер PRO ● Лучший генератор речи по образцу голоса ● RU ● Portable by NerualDreming Ссылка на GitHub(форк):https://github.com/rsxdalv/VibeVoice Репакер:#NerualDreming Дата обновления: 1 сентября 2025 Версия: 1.1 Категории:#TTS, #voiceclone, #AIaudio, #podcast Платформа:#Windows Язык: RU Место на диске: до 40 ГБ (включая все три модели) Системные требования: NVIDIA GPU 8/16/24 ГБ VRAM Совместимость:#Nvidia 🖥Описание софта VibeVoice — это легендарный инструмент для генерации речи, который задал новую планку качества в клонировании голоса. Технология оказалась настолько совершенной, что Microsoft удалила код и модели через сутки после публикации из-за опасений злоупотреблений. Мы нашли оригинальную большую модель и собрали для неё удобный и функциональный интерфейс. Это незаменимый инструмент для создателей контента, разработчиков игр, рекламщиков и всех, кто работает со звуком. Модель идеально передает тончайшие нюансы голоса, интонации и эмоциональную окраску, делая синтезированную речь практически неотличимой от настоящей. В комплекте — 50 готовых голосов от нашего сообщества. 😬Основные возможности VibeVoice Подкастер PRO 🟣 Отличная поддержка русского языка: Модель прекрасно понимает и генерирует русскую речь, сохраняя естественность и правильные интонации. 🟣 Три модели на выбор для разных GPU: • VibeVoice-1.5B: требует 8 ГБ VRAM (генерирует аудио до 90 минут) • VibeVoice-7B: требует 16 ГБ VRAM (промежуточная модель) • VibeVoice-Large: требует 24 ГБ VRAM (генерирует аудио до 45 минут) 🟣 Генерация длинных аудио: Создавайте целые подкасты или аудиокниги длиной до 90 минут за один раз. (мы не проверяли) 🟣 Мульти-голосовая генерация: Поддержка до 4 разных дикторов в одном аудиофайле с естественными переходами. 🟣 Естественная подача и эмоции: Модель превосходно улавливает контекст, ставит правильные ударения и управляет эмоциональной окраской речи. 🟣 Тонкая настройка: Доступ к расширенным параметрам для полного контроля над процессом генерации. 🟣 Гибкость форматов: Сохранение результата в трех популярных аудиоформатах на выбор. 🟣 Готовая библиотека голосов: 50 тщательно отобранных голосов доступны сразу после установки, еще больше — в нашем чате. 🟣 Удобный интерфейс: Полностью русифицированный интерфейс с возможностью прослушивания и загрузки своих образцов голоса. ⚠️Известныепроблемы:В зависимости от контекста, VibeVoice может самопроизвольно генерировать звуковые эффекты, такие как фоновая музыка, аплодисменты или закадровый смех. Это не баг, а фича. Если шаги генерации не идут - перезапустите bat. Это может быть связано с слишком длинными образцами голоса, попробуйте использовать не больше 12 секунд - обрезать можно прямо в интерфейсе. 💿Установка и запуск: Примечание: Модели (1.5B, 7B, Large) не скачиваются сразу. Загрузка нужной модели начнется автоматически при первой попытке генерации. Для версии Installer (ZIP): ⁍ Скачайте ZIP-архив. ⁍ Распакуйте его в удобное место (путь без кириллицы и пробелов). ⁍ Запустите файл install.bat для установки окружения. ⁍ После завершения установки, для работы используйте run_demo.bat. Для версии ENV (7z): ⁍ Скачайте 7z-архив. ⁍ Распакуйте его в удобное место. ⁍ Для работы сразу запустите файл run_demo.bat. ➡️ Скачать архиватор 7z ➡️Скачать VibeVoice PRO Portable Installer (ZIP) — ZIP-архив с полным установщиком (скачает окружение). ➡️Скачать VibeVoice PRO Portable ENV (7z)— обычный 7z-архив с готовым окружением (модели скачиваются при первом использовании). 💬Обсудить в чате | ⭐️Поддержать канал 👾НЕЙРО-СОФТ — Делаем нейросети доступнее.

🎙Vikhr Borealis ● Speech-to-Text ●Транскрипция русской речи в текст ● Portable by NerualDreming Ссылка на оригинальный релиз: https://huggingface.co/Vikhrmodels/Borealis Репакер:#NerualDreming Дата обновления: 25 сентября 2025 Версия: 1.0 Категории:#stt, #speechtotext, #audiollm Платформа:#Windows Место на диске: 20 ГБ Системные требования: NVIDIA GPU с не менее 6 ГБ VRAM Совместимость:#Nvidia 🖥Описание софта Borealis - это первая audio llm c ASR для русского языка от команды Vikhr. Важным отличием от других моделей является поддержка пунктуации в распознанных аудио. По замерам команды Vikhr, Borealis показывает меньшее количество ошибок и лучше соблюдает пунктуацию по сравнению с Whisper. В этой портативной сборке я сделал удобную оболочку, в которую можно загрузить как аудио, так и видео и легко превратить речь в текст. Давайте поддержим отечественного производителя! 😬 Основные возможности Vikhr Borealis: 🟣 Распознавание речи в текст для русского языка 🟣 Корректная расстановка знаков препинания 🟣 Более низкое количество ошибок по сравнению с аналогами 🟣 Возможность обработки как аудио, так и видео файлов 🟣 Удобный и простой в использовании интерфейс 💿Установка и запуск: ⁍ Скачайте Установщик или готовое Окружение. ⁍ Распакуйте архив в удобное место (без кириллицы и пробелов в пути). ⁍ Если скачали установщик, запустите файл install.bat и дождитесь окончания установки. ⁍ Для запуска программы используйте файл run_demo.bat. ⁍ Интерфейс приложения автоматически откроется в вашем браузере. ➡️Скачать Vikhr Borealis Portable (Установщик) - сам скачает и установит все необходимые компоненты. ➡️Скачать Vikhr Borealis Portable (Готовое окружение) - архив со всеми компонентами - скачает модели после запуска. 💬Обсудить в чате | ⭐️Поддержать канал 👾НЕЙРО-СОФТ — Делаем нейросети доступнее.

👄 LatentSync ● Синхронизация движения губ с аудио ● RU ● Portable by NerualDreming Ссылка на оригинальный GitHub:https://github.com/bytedance/LatentSync Репакер:#NerualDreming Дата обновления: 11 января 2025 Версия: 1.0 Категории:#lipsync, #AIvideo, #video2video Платформа:#Windows Язык: RU Место на диске: 17 ГБ Системные требования: NVIDIA GPU с не менее 8 ГБ VRAM Совместимость:#Nvidia 🖥Описание софта: LatentSync - это инновационный инструмент для синхронизации движения губ с аудио на основе латентных диффузионных моделей. Особенность системы в том, что она создает естественную и точную синхронизацию губ с речью без промежуточных этапов обработки, что делает результат более качественным и реалистичным. 😬Основные возможности LatentSync: 🟣 Высокоточная синхронизация движения губ с аудио 🟣 Сохранение естественной мимики лица 🟣 Поддержка как реальных, так и анимированных видео 🟣 Простой и понятный интерфейс 💿Установка и запуск: ⁍ Скачайте zip архив LatentSync ⁍ Распакуйте архив в удобное место (без кириллицы и пробелов в пути) ⁍ Запустите файл install-script.bat ⁍ Дождитесь окончания установки (будет выведено соответствующее сообщение) ⁍ Запустите start_latentsync.bat для начала работы ➡️Скачать LatentSync Portable ZIP — обычный ZIP архив 💬Обсудить в чате | ⭐️Поддержать канал 👾НЕЙРО-СОФТ — Делаем нейросети доступнее.

🎙 VoxCPM2 Portable ● Синтез и клонирование голоса + авто-обучение LoRA одним кликом ● RU ● by NerualDreming Ссылка на GitHub:https://github.com/timoncool/VoxCPM2_portable Автор:#NerualDreming Дата обновления: 19 апреля 2026 Версия: 1.0 Категории: #AIaudio, #TTS, #voicecloning, #LoRA Платформа:#Windows Язык: RU, EN Место на диске: 20 ГБ Системные требования: NVIDIA GPU 8+ ГБ VRAM, 16+ ГБ RAM Совместимость:#Nvidia#CPU 🖥Описание софта VoxCPM2 Portable — это портативная сборка open-source модели VoxCPM2 от OpenBMB (2 миллиарда параметров, 2 миллиона часов обучающей речи) с русскоязычной Gradio-студией. Делает три вещи: синтез речи на 30 языках с автоопределением, Voice Design (новый голос из текстового описания без референса) и клонирование голоса по короткому референсу. Выход — студийные 48 kHz через AudioVAE V2 super-resolution. Есть live-стриминг — аудио начинает играть во время генерации, не надо ждать окончания синтеза. И вот что главное — это очень мощная система для клонирования голоса, работает быстро, качество отличное. Как киллер-фича — можно обучить LoRA на любом голосе. Я решил развить эту идею и сделал автоматический пайплайн для подготовки датасета. Всё что вам надо — закинуть видео или аудио, а дальше умный пайплайн сам нарежет его на голосовые клипы, скачает ASR-модель, сделает транскрипцию и подготовит клипы для обучения LoRA. Вам буквально надо нажать одну кнопку, чуть подождать — и вот лучшее из open-source качество синтеза голоса уже у вас. 😬Основные возможности VoxCPM2 Portable: 🟣 Синтез речи на 30 языках с автоопределением, 48 kHz студийное качество через AudioVAE V2 🟣 Voice Design — создание голосов из текстового описания (пол, возраст, эмоция, акцент), zero-shot 🟣 Voice Cloning — клонирование по 5-50 секундам референса, с опциональным Ultimate-режимом 🟣 Живое стриминг-воспроизведение: аудио начинает играть во время генерации, не надо ждать 🟣 Пак из 100+ готовых голосов + 743 русских голоса по запросу из Slait/russia_voices 🟣 Контроль стиля: «чуть быстрее, бодрым тоном», «шёпотом, интимно», «медленно и драматично» 🟣 Форматы вывода MP3 / WAV / FLAC / OGG 🟣 Авто-обучение LoRA из видео: ffmpeg → Parakeet TDT 0.6B v3 INT8 (NVIDIA NeMo, 25 европейских языков) + Silero VAD → нарезка по предложениям → авто-подбор параметров → запуск тренировки. Одна кнопка 🟣 Ручной режим тренировки LoRA для заранее подготовленных датасетов 🟣 Hot-swap LoRA — переключение между моделями без перезапуска приложения 🟣 ZipEnhancer денойзер для шумных референсов 🟣 Все параметры модели в UI: CFG, Inference Steps, Min/Max длина, Retry, Seed 🟣 Flash Attention 2 из коробки (RTX 40xx / 50xx), xformers, Triton, bfloat16 🟣 i18n RU/EN с переключением в шапке, тёмная тема, FFmpeg в комплекте 💿Установка и запуск ⁍ Скачайте архив с установщиком или клонируйте репозиторий ⁍ Запустите install.bat — выберите поколение вашей видеокарты ⁍ Установщик сам скачает Python 3.12, PyTorch, voxcpm, Flash Attention 2, FFmpeg ⁍ Запустите run.bat — приложение откроется в браузере ⁍ Модели подтянутся при первом запуске (VoxCPM2 ~4-5 ГБ; Parakeet ASR ~670 МБ — лениво при первом клике на авто-подготовку) ⁍ Используйте update.bat для обновлений ⭐️Поставить звезду на GitHub — вам не сложно, а другим будет проще найти проект ➡️Скачать Portable установщик — скачает всё что нужно ➡️Скачать Portable env win11 rtx4090 — окружение под Win 11 и RTX 4090 ➡️Установка в 1 клик через Pinokio — сначала нужно скачать сам установщик Pinokio 💬Обсудить в нашем чате 👾НЕЙРО-СОФТ - делаем нейросети доступнее

✍️ JoyCaption Ultimate α2 (2024-09-26) ● Генератор описаний и тегов для изображений с режимом пакетной обработки ● RU ● by NerualDreming & Slait Ссылка на оригинальный GitHub:https://github.com/fpgaminer/joycaption Репакеры: #NerualDreming, #Slait Дата обновления модели: 26 сентября 2024 Версия: α2 Категории:#captioning, #AIvision, #img2txt Платформа:#Windows Язык: RU Место на диске: 20 ГБ Системные требования: NVIDIA GPU 12gb VRAM Совместимость:#Nvidia 🖥Описание софта: JoyCaption — инструмент для генерации подробных описаний изображений в различных стилях и форматах. Незаменим для создания описаний изображений при подготовке тренировочных датасетов. Полезен для получения промптов из любых изображений. Адекватно работает с NSFW-концепциями и тегами. В этой русифицированной модифицированной сборке добавлена поддержка пакетной обработки файлов, сохранение обработанных изображений в директорию проекта, перевод интерфейса и многое другое для удобства работы. Всё работает локально, используя квантованную модель nf4 для экономии ресурсов и увеличения скорости обработки. 😬 Основные возможности JoyCaption α2: 🟣9 режимов генерации (описание, SD-промпты, MidJourney, booru-теги, соцсети и др.) 🟣Расширенные инструкции: имя персонажа, свет, композиция, глубина, качество 🟣Формальный и неформальный стиль 🟣Выбор длины описания 🟣Поддержка пользовательских промптов 🟣Сохранение промптов и изображений в отдельную папку 🟣Возможность визуально проверить и исправить вручную неудачные промпты в пакетном режиме, с повторным сохранением по одному, или всех сразу 🟣Переведённый UI и простой запуск 💿Установка и запуск: ⁍ Скачайте 7z архив JoyCaption с установщиком или с окружением ⁍ Разархивируйте с помощью 7-Zip ⁍ Распакуйте архив в удобное место (без кириллицы и пробелов в пути) ⁍ Запустите файл installer.bat если скачали установщик ⁍ Запустите файл start_joy_caption.bat если скачали версию с готовым окружением ⁍ После загрузки моделей интерфейс откроется в браузере ➡️ Скачать архиватор 7z ➡️joy_caption_ultimate_portable_installer.7z — установщик, всё скачает сам ➡️joy_caption_ultimate_portable_environment.7z — готовое окружение, скачиваются только модели 💬Обсудить в чате | ⭐️Поддержать канал 👾НЕЙРО-СОФТ — Делаем нейросети доступнее.

12
ПретходнаСтраница 1 од 2Следна