@iokhk · Post #9741 · 07.05.2026 г., 10:58
超 600 种语言,一个模型全搞定! 小米开源 OmniVoice 多语言语音克隆 TTS#TTS
Hashtags
TGINSIGHT SIMILAR POSTS
Изходен канал @clockstackwheels · Post #458 · 24.07
Есть такая игра TrackMania, я вам уже про неё когда-то давно писал. Это очень аркадная гонка. Настолько аркадная, что автомобили на трассе никак друг с другом не взаимодействуют (вы не можете столкнуться с соперником, просто проедете сквозь него), и задача игрока состоит в том, чтобы сражаться со сложностью трассы. А трассы обычно включают в себя прыжки, мёртвые петли, движение по стенам и так далее. Разумеется, нужно пройти трассу быстрее, чем остальные. "Пройти трассу" с точки зрения движка игры означает следующее: корпус автомобиля в любом порядке пересекает чекпоинты, а затем попадает в область финиша. Ещё физический движок у игры идемпотентный: одинаковый набор управляющих воздействий всегда в точности приводит к тому же положению автомобиля и тем же векторам линейной и угловой скорости. Это создаёт ситуацию, при которой повтор прохождения игроком какой-либо трассы можно записать просто как цепочку нажатий на клавиши управления в заданные моменты времени. Так что игроки могут этими повторами обмениваться и соревноваться асинхронно: один проходит трассу за 2 минуты и 19 секунд, загружает свой результат в сеть, а другой через неделю соревнуется и с ним и побеждает, проходя трассу за 2 минуты 18 секунд. Вокруг этой игры создалось очень большое и активное сообщество людей, которые друг с другом соревнуются и ставят рекорды. Эти игроки проводят в TrackMania десятки часов в неделю, и зачастую сами себе создают челленджи. Например, пройти все трассы в игре, никогда не поворачивая вправо. Или пройти задним ходом. Или даже с закрытыми глазами, ориентируясь по звукам и таймеру. Ещё в игре есть редактор трасс, и поэтому сообщество создаёт очень сложные многоуровневые треки для всех желающих. Так вот, интересный момент. Как я уже говорил, движок засчитывает прохождение по довольно формальным признакам. Поэтому технически совсем не обязательно проехать на машине по дороге. Если вы каким-то образом заставите машину взлететь и проскакать с более быстрой скоростью — это валидный рекорд. И сообщество тоже такое принимает и даже всячески восхищается игроками, которые смогли обмануть игровой движок и найти, что называется, shortcut. Профессиональные игроки владеют набором специальных багов. Например, если определённым образом поставить машину боком под правильным углом с правильной скоростью, трение торможения уменьшится, и можно будет пройти какой-то кривой участок быстрее. Ещё можно под нужным углом удариться о поверхность и отскочить от неё куда требуется. И таких обманов движка пара десятков. Нередко игрокам приходится их комбинировать, поэтому они сидят десятки и сотни часов, проходя одну и ту же трассу, чтобы получить идеальное стечение обстоятельств ради улучшения времени на одну сотую секунды. Не преувеличиваю. При этом, однако же, читерство и "внешние" обманы в игре очень сильно критикуются. Если тебя заподозрят в использовании программы, которая за тебя нажимает клавиши, или в какой-нибудь подделке памяти — это смерть для твоей репутации в сообществе. Вот какое дело получается: разработчики заложили формальные правила игры (ехать на машине по дороге), и нарушение этих правил поощряется. Но нарушение правил игрового движка уже жёстко критикуется. Чисто практически разница между этими правилами очень условная: и то, и другое это отступление от игры в том виде, в котором игра задумана. Но людям нужно было где-то поставить границу, после которой издевательство над игрой уже не обладает зрелищностью и спортивной составляющей, так и получилось. На видео ниже норвежский про-игрок с ником Wirtual рассказывает об одном из таких случаев, по-моему, очень интересно и напряжённо вышло :) #games https://www.youtube.com/watch?v=_b67SC7Y4qA
Hashtags
Търсене: #tts
@iokhk · Post #9741 · 07.05.2026 г., 10:58
超 600 种语言,一个模型全搞定! 小米开源 OmniVoice 多语言语音克隆 TTS#TTS
Hashtags
@awesomeopensource · Post #142 · 21.07.2018 г., 06:06
Tacotron 2 机器学习TTS的最新成果,使用电脑生成逼真的语音音频,在中文语音合成方面也已经取得进展,很快我们就可以告别讯飞,百度非自由TTS的垄断了。 Tensorflow实现 Rayhane-mamah/Tacotron-2 PyTorch实现 NVIDIA/tacotron2 Tags: #TTS
Hashtags
@bamaogong · Post #696 · 23.06.2025 г., 03:34
#网站#TTS 🗣AudioTextHub - 免费 AI 文本转语音工具 ▎网站介绍:一个基于 AI 的在线文本转语音平台,支持超过 100 种语言和 500 多种语音角色,用户可将文字快速转换为自然流畅的语音,并支持 MP3、WAV、OGG 等格式下载。 无需注册即可免费使用,每日最多 200 次转换,每次支持最多 2000 字,还提供批量生成、语速音调调整和情感表达等功能。 ▎网站网址:点击打开
@bamaogong · Post #648 · 07.06.2025 г., 02:11
#网站#TTS 🔊Ciallo TTS - 免费在线文本转语音工具 ▎网站介绍:一个文字转语音工具,支持 300 多种语言和口音,提供语速和语调的调节功能,支持最长 100,000 字符的文本输入。 用户只需输入文本,选择语音引擎(如 Edge TTS、OpenAI TTS)和语音人物,即可快速合成高质量语音,并生成 MP3 文件保存下载。 ▎网站网址:点击打开
@ai_machinelearning_big_data · Post #9901 · 15.04.2026 г., 16:13
⭐️ Google DeepMind представил Gemini 3.1 Flash TTS - свою самую управляемую модель генерации речи Главная фишка - Audio Tags. Это текстовые команды прямо в промпте, которыми можно управлять стилем голоса, подачей и темпом речи. По сути, вы режиссируете озвучку через текст. Что ещё важно: — Более естественное звучание речи — Поддержка 70+ языков (русский, японский, немецкий и др.) — Все выходные аудио маркируются SynthID (цифровой водяной знак, чтобы отличить синтезированную речь от настоящей) На бенчмарке Artificial Analysis TTS Arena модель заняла 2-е место с Elo-рейтингом 1211 - сразу за Inworld TTS 1.5 Max (1215) и выше ElevenLabs v3 (1179). Где попробовать: → Рreview через Gemini API и Google AI Studio → Бизнесу -а Vertex AI → Всем пользователям - скоро появится в Google Vids https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-flash-tts/ @ai_machinelearning_big_data #google `#tts
@AChansp · Post #1758 · 18.04.2024 г., 09:55
#群聊#tts https://t.me/MultiTTS
@bamaogong · Post #517 · 25.04.2025 г., 02:11
#网站#开源#TTS 🗣EasyVoice - 开源文本转语音工具 ▎网站介绍:一个文本、小说智能转语音解决方案,支持将 10 万字以上的小说一键转为有声书,完全免费,无时长、无字数限制。 支持一键生成语音和字幕、AI 智能推荐配音、自定义多角色配音、自定义调整语速、音调等参数,并且在生成前可试听效果。 ▎网站网址:点击打开
@AboutRss · Post #1241 · 16.08.2022 г., 01:00
Speak News: 主打 text-to-speech 的 RSS 阅读器 该 #iOS / #iPadOS App 于 2016 年发布,更新至今,主打 #TTS ,但是售价较高: http://www.imaja.com/speaknews/ 发现于 https://twitter.com/SpeakNewsApp/status/1546575379191566336
@xxluoxx · Post #60 · 18.08.2022 г., 15:09
自带微软TTS的合成软件 网页版:https://toolb.cn/textspeech 🏷#TTS#语音合成
@ai_machinelearning_big_data · Post #9305 · 23.12.2025 г., 15:59
🗣 Новая линейка Qwen3-TTS: VoiceDesign и VoiceClone Qwen представили новое поколение TTS-моделей, которые выводят управление голосом и voice cloning на новый уровень. Быстрее, выразительнее и гибче, чем раньше. VoiceDesign-VD-Flash Модель для полного конструирования голоса с нуля. Что умеет: - полный контроль речи через обычные текстовые инструкции - управление тоном, ритмом, эмоциями и персоной - никаких готовых голосов - ты создаешь уникальную вокальную идентичность - превосходит GPT-4o-mini-tts и Gemini-2.5-pro в role-play бенчмарках Подходит для: - игровых персонажей - виртуальных ассистентов - сторителлинга и диалогов - AI-персонажей с характером VoiceClone-VC-Flash Фокус на быстрое и качественное клонирование голоса. Ключевые возможности: - клонирование любого голоса всего по 3 секундам аудио - генерация речи на 10 языках (китайский, английский, японский, испанский и другие) - на 15% ниже WER по сравнению с ElevenLabs и GPT-4o-Audio в мультиязычных тестах - контекстно-зависимая интонация и ритм для более естественного звучания https://x.com/Alibaba_Qwen/status/2003445076257656880 Попробовать: •Qwen Chat:http://chat.qwen.ai •Блог: https://qwen.ai/blog?id=qwen3-tts-vc-voicedesign • VoiceDesign: http://hf.co/spaces/Qwen/Qwen3-TTS-Voice-Design http://modelscope.cn/studios/Qwen/Qwen3-TTS-Voice-Design • VoiceClone: http://hf.co/spaces/Qwen/Qwen-TTS-Clone-Demo http://modelscope.cn/studios/Qwen/Qwen-TTS-Clone-Demo @ai_machinelearning_big_data #AI#TTS#voicecloning
Hashtags
@libreware · Post #1544 · 12.02.2026 г., 07:09
anx-reader Anx Reader is an advanced e-reader designed for book lovers, providing intelligent and focused reading. It supports various #ebook formats, including EPUB, MOBI, AZW3, FB2, TXT, and PDF, and offers powerful AI features such as shelf organization by progress and tone, mind map generation for deep understanding, a built-in dictionary and translator, perspective analysis, and summary generation. #TTS The program offers cross-platform syncing across Android, iOS, macOS, and Windows devices, allowing you to sync books, notes, and reading progress via WebDAV. Additional features include customizable reading settings (font size and style, line spacing, themes), a workspace for notes with export options, and reading stats tracking with habit visualization. Lang: Dart https://github.com/Anxcye/anx-reader Via @open_source_friend
@appmew · Post #16881 · 07.04.2026 г., 01:55
CloneTTS:安卓本地离线音色克隆与系统级 TTS 引擎。3 秒样本即可复刻专属人声,不需要联网 🏷标签:#安卓#TTS#声音克隆 ☁链接:点击获取 ⭐频道😮群聊✏投稿🌍中文