TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #367 · 30.05

Поговорим про ML. Пару дней назад вышла новость о том, что в продажу поступила первая русскоязычная книга, половину текста в которой написала нейросеть ruGPT-3. А до этого вы все наверняка натыкались на очень яркие записи про Dalle и Imagen, где нейросеть по описанию рисует картинку, и получается очень любопытно. Такими темпами скоро нейросети превратятся в крипту: высокотехнологичную вещь, о которой, однако, в среде приличных технарей лучше не упоминать. Потому что то, каким образом это используется, и то, какой образ этому создают в массах, расходится не только с реальностью, но и с определённым уровнем вменяемости. Кстати, ML ещё и может ярко демонстрировать эффект Даннинга-Крюгера. Мем про "Ты чё, пёс, я математик!" нифига не шутка. Человек может считать себя крутым программистом, если научился комбинировать чужие библиотеки на питоне. Хотя на самом деле простейшую практическую задачу решить не способен -- я с такими сталкивался лично. ML-щики вообще пихают свои нейросети куда ни попадя, считая, что это волшебная таблетка и швейцарский нож для любых ситуаций. Мне рассказывали случай, когда на хакатоне по работе с данными выиграл человек, который просто аккуратно вручную подобрал нужные зависимости в Excel :) Глобально же нейросетями пытаются решать три вида задач: 1. Информации в вопросе много, а в ответе нужно мало. Например, распознавание образов и символов. Подбор значений каких-нибудь коэффициентов. Приложение "Хотдог или не хотдог" из сериала Кремниевая Долина. Обычно нейросети справляются с таким очень хорошо. Рукописный ввод распознают шикарно, по фото могут назвать породу собаки, математические формулы читают. Но важно понимать, что под капотом даже у такой нейросети не возникает никаких понятных вам символов. Например, при распознавании рукописного ввода случайный набор пикселей, не имеющий для человека смысла, может быть с той же степенью уверенности интерпретирован нейросетью, как совершенно чёткая буква А. Просто мы на такой случайный набор не попадаем почти всегда, и поэтому всё ок. 2. Информации в вопросе средне, и в ответе нужно средне. Как правило, это предсказание, восстановление недостающих данных, улучшение качества фото, раскрашивание ч/б. С такими задачами нейросети справляются уже средненько. Улучшенный нейросетью снимок сразу видно. Предсказание лишь ненамного точнее, чем случайный выбор. Польза в том, что в обращении такие сети просты, а результат всё-таки дают. Но не стоит их переоценивать. Например, сюда можно отнести задачу суммаризации текста (по большому объёму текстов тебе печатают выжимку). Мои товарищи в одном чате несколько дней игрались с ботом-суммаризатором, и в основном половина написанных им фраз это просто мусор и ерунда для ржача. Но в другой половине всё-таки какой-то совсем небольшой смысл проглядывался. Недостаточный для того, чтобы задалбывать этим ботом участников чата (привет, ребята :) ), но не абсолютный рандом. 3. Информации в вопросе мало, а в ответе нужно много. Это генерация данных: вот как раз написание текстов, составление рисунков, логотипов и так далее. Так вот, по моему скромному, но всё-таки хоть немного компетентному мнению, в таких вопросах нейросети выдают полную херню. И хвалёная логотипная нейросетка Лебедева — тоже полная херня. И распиаренная GPT ничего толкового не пишет. Когда читаешь примеры в новостях-анонсах, сразу думаешь: "Вау, как круто!". Но когда пробуешь сам: ruGPT-3 по уровню осмысленности где-то чуть ниже "Яндекс.Рефератов", если помните такой сервис и суть его работы. Я не знаю, будут ли сети по созданию изображений работать так круто (сейчас доступа к ним ни у кого нет), но книга в соавторстве с человеком стала возможна только по той причине, что в качестве человека взяли Павла Пепперштейна, который берёт случайные комбинации словосочетаний и выдаёт это за литературу. Поверьте: человечество пока что в безопасности касательно захвата машинами. #dev

Hashtags

Резултати

Намерени 4 подобни публикации

Търсене: #voiceclone

当前筛选 #voiceclone清除筛选

🐠 Fish Speech MOD ● Модифицированная версия синтезатора речи с клонированием голоса ● RU ● Portable by NerualDreming Ссылка на оригинальный GitHub:https://github.com/fishaudio/fish-speech Репакер:#NerualDreming Дата обновления: 15 января 2025 Версия: 1.4.3 Категории:#TTS, #voiceclone, #AIaudio Платформа:#Windows Язык: RU Место на диске: 10 ГБ Системные требования: NVIDIA GPU 8gb Совместимость:#Nvidia 🖥Описание софта: Fish Speech - это мощный инструмент для синтеза речи с возможностью клонирования голоса. Особенность данной модифицированной версии в том, что она адаптирована для русскоязычных пользователей и дополнена новыми функциями для более удобной работы. 😬Основные возможности Fish Speech: 🟣 Клонирование голоса по образцу 15-60 секунд 🟣 Поддержка русского и других языков (английский, японский, корейский, китайский, французский, немецкий, арабский, испанский) 🟣 Высокая точность синтеза речи 🟣 Сохранение в форматах MP3 и FLAC 🟣 Полностью русифицированный интерфейс 🟣 Упрощенная работа с папкой examples - достаточно добавить MP3 и текстовый файл с расшифровкой для добавления новых голосов 🟣 Оптимизированный интерфейс без неиспользуемых элементов 📣Встроенные голоса: 🔘 Крастер (YouTube) 🔘 Губка Боб 🔘 Тинькофф (YouTube) 🔘 Кропина (YouTube, женский) 🔘 Бухмин (AudioBook) 🔘 Володарский 🔘 Гоблин Пучков (YouTube) 🔘 Дедпул (Гланц) 🔘 Денис Колесников (YouTube) 🔘 5 дополнительных женских голосов на английском языке ⚠️Отказ от ответственности: Все примеры голосов взяты из открытых источников и представлены с уважением к их носителям и исключительно в демонстрационных целях. Для коммерческого использования рекомендуем обращаться к авторам. Несанкционированное использование чужих голосов в коммерческих целях и без разрешений не только нарушает права их владельцев, но и может преследоваться по закону. Мы категорически запрещаем и осуждаем использование данной технологии для нарушения чьих-либо прав или для совершения противоправных действий! 💿Установка и запуск: ⁍ Скачайте zip архив Fish Speech ⁍ Распакуйте архив в удобное место ⁍ Запустите файл install.bat ⁍ Дождитесь окончания установки (будет выведено соответствующее сообщение) ⁍ Запустите start.bat для начала работы ➡️Скачать Fish Speech Mod Portable ZIP — обычный ZIP архив 💬Обсудить в чате | ⭐️Поддержать канал 👾НЕЙРО-СОФТ — Делаем нейросети доступнее.

🎭Fish Speech Dialogue DLC ● Система для озвучивания диалогов различными голосами ● RU ● by NerualDreming Ссылка на Fish Speech MOD: https://t.me/neuroport/134 Репакер:#NerualDreming Дата обновления: 15 февраля 2025 Версия: 0.06 Категории:#TTS, #voiceclone, #AIaudio, #dialogue Платформа:#Windows Язык: RU Место на диске: 10kb Системные требования: NVIDIA GPU 8GB Совместимость:#Nvidia 🖥Описание софта: Fish Speech Dialogue — это мощное дополнение на базе Fish Speech MOD, разработанное для генерации озвучки целых диалогов с использованием различных голосов. Этот инструмент позволяет автоматически распознавать и назначать голоса говорящим в диалоге, что делает процесс создания озвучки быстрым и удобным. Это мой первый эксперимент такого рода на базе одного приложения, создано другое. Это не отдельное приложение, это дополнение которое устанавливается в папку к уже существующему Fish Speech MOD. 😬Основные возможности Fish Speech Dialogue: 🟣Автоматическое распределение голосов: Просто вставьте текст диалога, в формате Говорящий 1: и система автоматически определит говорящих и назначит им случайные голоса. 🟣Поддержка до 10 говорящих: Создавайте сложные диалоги с большим количеством участников (хотя автор не тестировал так много говорящих, поэтому возможны некоторые ограничения). 🟣Гибкая настройка голосов: Использует ту же базу голосов, что и Fish Speech MOD из папки examples. Все готово сразу после установки. Дополнительные голоса. 🟣Форматы сохранения: Сохраняйте результаты в форматах WAV, MP3 и FLAC. 🟣Расширенные настройки: Настройте параметры генерации, такие как длина промпта, максимальное количество токенов, температура и штраф за повторение. 💿Установка и запуск: ⁍ Скачайте zip архив Fish Speech Dialogue. ⁍ Распакуйте архив в ту же директорию, где находится Fish Speech MOD. ⁍ Запустите файл start_dialogue.bat. ⁍ После загрузки компонентов интерфейс приложения откроется в браузере. ➡️Скачать Fish Speech Dialogue ZIP — обычный ZIP архив 💬Обсудить в чате | ⭐️Поддержать канал 👾НЕЙРО-СОФТ — Делаем нейросети доступнее.

🎙 VibeVoice Подкастер PRO ● Лучший генератор речи по образцу голоса ● RU ● Portable by NerualDreming Ссылка на GitHub(форк):https://github.com/rsxdalv/VibeVoice Репакер:#NerualDreming Дата обновления: 1 сентября 2025 Версия: 1.1 Категории:#TTS, #voiceclone, #AIaudio, #podcast Платформа:#Windows Язык: RU Место на диске: до 40 ГБ (включая все три модели) Системные требования: NVIDIA GPU 8/16/24 ГБ VRAM Совместимость:#Nvidia 🖥Описание софта VibeVoice — это легендарный инструмент для генерации речи, который задал новую планку качества в клонировании голоса. Технология оказалась настолько совершенной, что Microsoft удалила код и модели через сутки после публикации из-за опасений злоупотреблений. Мы нашли оригинальную большую модель и собрали для неё удобный и функциональный интерфейс. Это незаменимый инструмент для создателей контента, разработчиков игр, рекламщиков и всех, кто работает со звуком. Модель идеально передает тончайшие нюансы голоса, интонации и эмоциональную окраску, делая синтезированную речь практически неотличимой от настоящей. В комплекте — 50 готовых голосов от нашего сообщества. 😬Основные возможности VibeVoice Подкастер PRO 🟣 Отличная поддержка русского языка: Модель прекрасно понимает и генерирует русскую речь, сохраняя естественность и правильные интонации. 🟣 Три модели на выбор для разных GPU: • VibeVoice-1.5B: требует 8 ГБ VRAM (генерирует аудио до 90 минут) • VibeVoice-7B: требует 16 ГБ VRAM (промежуточная модель) • VibeVoice-Large: требует 24 ГБ VRAM (генерирует аудио до 45 минут) 🟣 Генерация длинных аудио: Создавайте целые подкасты или аудиокниги длиной до 90 минут за один раз. (мы не проверяли) 🟣 Мульти-голосовая генерация: Поддержка до 4 разных дикторов в одном аудиофайле с естественными переходами. 🟣 Естественная подача и эмоции: Модель превосходно улавливает контекст, ставит правильные ударения и управляет эмоциональной окраской речи. 🟣 Тонкая настройка: Доступ к расширенным параметрам для полного контроля над процессом генерации. 🟣 Гибкость форматов: Сохранение результата в трех популярных аудиоформатах на выбор. 🟣 Готовая библиотека голосов: 50 тщательно отобранных голосов доступны сразу после установки, еще больше — в нашем чате. 🟣 Удобный интерфейс: Полностью русифицированный интерфейс с возможностью прослушивания и загрузки своих образцов голоса. ⚠️Известныепроблемы:В зависимости от контекста, VibeVoice может самопроизвольно генерировать звуковые эффекты, такие как фоновая музыка, аплодисменты или закадровый смех. Это не баг, а фича. Если шаги генерации не идут - перезапустите bat. Это может быть связано с слишком длинными образцами голоса, попробуйте использовать не больше 12 секунд - обрезать можно прямо в интерфейсе. 💿Установка и запуск: Примечание: Модели (1.5B, 7B, Large) не скачиваются сразу. Загрузка нужной модели начнется автоматически при первой попытке генерации. Для версии Installer (ZIP): ⁍ Скачайте ZIP-архив. ⁍ Распакуйте его в удобное место (путь без кириллицы и пробелов). ⁍ Запустите файл install.bat для установки окружения. ⁍ После завершения установки, для работы используйте run_demo.bat. Для версии ENV (7z): ⁍ Скачайте 7z-архив. ⁍ Распакуйте его в удобное место. ⁍ Для работы сразу запустите файл run_demo.bat. ➡️ Скачать архиватор 7z ➡️Скачать VibeVoice PRO Portable Installer (ZIP) — ZIP-архив с полным установщиком (скачает окружение). ➡️Скачать VibeVoice PRO Portable ENV (7z)— обычный 7z-архив с готовым окружением (модели скачиваются при первом использовании). 💬Обсудить в чате | ⭐️Поддержать канал 👾НЕЙРО-СОФТ — Делаем нейросети доступнее.

🎭Fish Speech Dialogue Portable● Обновленная мультиязычная портативная версия с 50+ голосами ● RU+EN ● Portable by Shahmatist^RMDA Ссылка на оригинальный GitHub:https://github.com/shaitanzx/fish_speech/ Репакер:#Shahmatist/RMDA Дата обновления: 24 февраля 2025 Версия: 0.07 Категории: #TTS, #voiceclone, #AIaudio, #dialogue Платформа:#Windows Язык: RU, EN Место на диске: 10GB Системные требования: NVIDIA GPU 8GB Совместимость:#Nvidia 🖥Описание софта: Fish Speech Dialogue — это мощное решение для озвучки диалогов и отдельных реплик с использованием различных голосов. Новая портативная версия включает все необходимые компоненты и библиотеку из более чем 50 готовых голосов от сообщества. Теперь работает даже с одним говорящим. Больше не требуется установка базового Fish Speech MOD. Портативная версия. 😬Основные возможности Fish Speech Dialogue: 🟣 Поддержка от 1 до 10 говорящих в одном диалоге 🟣 Автоматическое распределение голосов в диалогах 🟣 Озвучка одиночных реплик и монологов 🟣 Более 50 готовых голосов от сообщества 🟣 Форматирование диалога "Говорящий: текст" 🟣 Форматы сохранения: WAV, MP3 и FLAC 🟣 Мультиязычный интерфейс (RU/EN) 🟣 Стабильная GitHub версия с автообновлением 🟣 Расширенные настройки для продвинутых пользователей 💿Установка и запуск: ⁍ Скачайте zip или exe архив Fish Speech Dialogue ⁍ Распакуйте в любую папку на диске ⁍ Запустите start.bat ⁍ После проверки обновлений и загрузки компонентов интерфейс откроется в браузере ➡️Скачать Fish Speech Dialogue 7z — архив с GitHub, без модели, модель скачается при запуске, используйте 7z для распаковки ➡️Скачать Fish Speech Dialogue exe — самораспаковывающийся архив 7z с моделью, после распаковки сразу готов к работе 💬Обсудить в чате | ⭐️Поддержать канал 👾НЕЙРО-СОФТ — Делаем нейросети доступнее.