@iokhk · Post #9741 · 07.05.2026 г., 10:58
超 600 种语言,一个模型全搞定! 小米开源 OmniVoice 多语言语音克隆 TTS#TTS
Hashtags
TGINSIGHT SIMILAR POSTS
Изходен канал @clockstackwheels · Post #337 · 7.05
На днях Еврокомиссия предъявила компании Apple обвинения в нарушении антимонопольного законодательства. Если дело выгорит, то яблокам грозит по-настоящему серьёзный штраф — до 20% от всего оборота. Нарушение как раз состоит в том, что Apple под флагом безопасности, как она это любит, запрещает сторонним приложениям использовать NFC-модуль для оплаты. Я уже об этом писал: на андроидах после блокировок можно платить телефоном через MirPay и аналоги, а вот айфоны вообще остались без инструмента оплаты в России. Это, конечно, совпадение, что такие разборки идут нам — русским, оставшимся в стране — на руку. Начало сбора материалов для этого дела было задолго до текущих событий. Впрочем, окончательно текст нужного закона согласован в ЕС только 24 марта — и я уверен, что они одним глазком посматривали на происходящее в России. Так, на всякий случай. Там в законе много интересного: 1. Компании обязаны давать пользователям возможность менять браузер по умолчанию и поисковый движок. Интересно, заставит ли это Apple разрешить использовать в сторонних браузерах какой-то иной движок, кроме Safari? Ведь из-за этого сам смысл альтернативных программ для просмотра web-страниц теряется почти полностью. 2. Платформам запрещается под угрозой исключения из магазина навязывать свои средства обработки платежей в приложениях. Судя по всему, здесь сыграл роль иск от Epic Games. 3. От встроенных средств обмена сообщениями требуют interoperability. Непонятно, означает ли это возможность работы между протоколами (например, отправлять из iMessage сообщения в WhatsApp), или всё-таки что-то не столь значительное. 4. Ну и да, разработчики смартфонов обязаны предоставить fair access to the supplementary functionalities, к которым относят и NFC. В теории это может означать ещё и, например, право для несистемных приложений выполнять на iOS фоновые процессы (сейчас это возможно только в качестве реакции на изменение координат). Мне нравится этот процесс и с чисто практической точки зрения и с идеологической. Я уже писал о том, что монополии — один из наиболее значительных недостатков капитализма. В теории вроде бы всё честно: компания делает продукт и имеет право предоставлять его людям на удобных ей условиях, потому что это их продукт. Но в данном случае Европа пользуется правом сильного, потому что может. Иронично: крупные компании по праву сильного и благодаря наличию возможности вставляют палки в колёса обычным потребителям, которые из-за этого не полностью могут пользоваться собственными же смартфонами. А антимонопольные комиссии по праву сильного и благодаря наличию возможности вставляют палки в колёса компаниям, которые из-за этого не полностью могут определять условия продаже собственной же продукции. #gadgets#web
Търсене: #tts
@iokhk · Post #9741 · 07.05.2026 г., 10:58
超 600 种语言,一个模型全搞定! 小米开源 OmniVoice 多语言语音克隆 TTS#TTS
Hashtags
@awesomeopensource · Post #142 · 21.07.2018 г., 06:06
Tacotron 2 机器学习TTS的最新成果,使用电脑生成逼真的语音音频,在中文语音合成方面也已经取得进展,很快我们就可以告别讯飞,百度非自由TTS的垄断了。 Tensorflow实现 Rayhane-mamah/Tacotron-2 PyTorch实现 NVIDIA/tacotron2 Tags: #TTS
Hashtags
@bamaogong · Post #696 · 23.06.2025 г., 03:34
#网站#TTS 🗣AudioTextHub - 免费 AI 文本转语音工具 ▎网站介绍:一个基于 AI 的在线文本转语音平台,支持超过 100 种语言和 500 多种语音角色,用户可将文字快速转换为自然流畅的语音,并支持 MP3、WAV、OGG 等格式下载。 无需注册即可免费使用,每日最多 200 次转换,每次支持最多 2000 字,还提供批量生成、语速音调调整和情感表达等功能。 ▎网站网址:点击打开
@bamaogong · Post #648 · 07.06.2025 г., 02:11
#网站#TTS 🔊Ciallo TTS - 免费在线文本转语音工具 ▎网站介绍:一个文字转语音工具,支持 300 多种语言和口音,提供语速和语调的调节功能,支持最长 100,000 字符的文本输入。 用户只需输入文本,选择语音引擎(如 Edge TTS、OpenAI TTS)和语音人物,即可快速合成高质量语音,并生成 MP3 文件保存下载。 ▎网站网址:点击打开
@ai_machinelearning_big_data · Post #9901 · 15.04.2026 г., 16:13
⭐️ Google DeepMind представил Gemini 3.1 Flash TTS - свою самую управляемую модель генерации речи Главная фишка - Audio Tags. Это текстовые команды прямо в промпте, которыми можно управлять стилем голоса, подачей и темпом речи. По сути, вы режиссируете озвучку через текст. Что ещё важно: — Более естественное звучание речи — Поддержка 70+ языков (русский, японский, немецкий и др.) — Все выходные аудио маркируются SynthID (цифровой водяной знак, чтобы отличить синтезированную речь от настоящей) На бенчмарке Artificial Analysis TTS Arena модель заняла 2-е место с Elo-рейтингом 1211 - сразу за Inworld TTS 1.5 Max (1215) и выше ElevenLabs v3 (1179). Где попробовать: → Рreview через Gemini API и Google AI Studio → Бизнесу -а Vertex AI → Всем пользователям - скоро появится в Google Vids https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-flash-tts/ @ai_machinelearning_big_data #google `#tts
@AChansp · Post #1758 · 18.04.2024 г., 09:55
#群聊#tts https://t.me/MultiTTS
@bamaogong · Post #517 · 25.04.2025 г., 02:11
#网站#开源#TTS 🗣EasyVoice - 开源文本转语音工具 ▎网站介绍:一个文本、小说智能转语音解决方案,支持将 10 万字以上的小说一键转为有声书,完全免费,无时长、无字数限制。 支持一键生成语音和字幕、AI 智能推荐配音、自定义多角色配音、自定义调整语速、音调等参数,并且在生成前可试听效果。 ▎网站网址:点击打开
@AboutRss · Post #1241 · 16.08.2022 г., 01:00
Speak News: 主打 text-to-speech 的 RSS 阅读器 该 #iOS / #iPadOS App 于 2016 年发布,更新至今,主打 #TTS ,但是售价较高: http://www.imaja.com/speaknews/ 发现于 https://twitter.com/SpeakNewsApp/status/1546575379191566336
@xxluoxx · Post #60 · 18.08.2022 г., 15:09
自带微软TTS的合成软件 网页版:https://toolb.cn/textspeech 🏷#TTS#语音合成
@ai_machinelearning_big_data · Post #9305 · 23.12.2025 г., 15:59
🗣 Новая линейка Qwen3-TTS: VoiceDesign и VoiceClone Qwen представили новое поколение TTS-моделей, которые выводят управление голосом и voice cloning на новый уровень. Быстрее, выразительнее и гибче, чем раньше. VoiceDesign-VD-Flash Модель для полного конструирования голоса с нуля. Что умеет: - полный контроль речи через обычные текстовые инструкции - управление тоном, ритмом, эмоциями и персоной - никаких готовых голосов - ты создаешь уникальную вокальную идентичность - превосходит GPT-4o-mini-tts и Gemini-2.5-pro в role-play бенчмарках Подходит для: - игровых персонажей - виртуальных ассистентов - сторителлинга и диалогов - AI-персонажей с характером VoiceClone-VC-Flash Фокус на быстрое и качественное клонирование голоса. Ключевые возможности: - клонирование любого голоса всего по 3 секундам аудио - генерация речи на 10 языках (китайский, английский, японский, испанский и другие) - на 15% ниже WER по сравнению с ElevenLabs и GPT-4o-Audio в мультиязычных тестах - контекстно-зависимая интонация и ритм для более естественного звучания https://x.com/Alibaba_Qwen/status/2003445076257656880 Попробовать: •Qwen Chat:http://chat.qwen.ai •Блог: https://qwen.ai/blog?id=qwen3-tts-vc-voicedesign • VoiceDesign: http://hf.co/spaces/Qwen/Qwen3-TTS-Voice-Design http://modelscope.cn/studios/Qwen/Qwen3-TTS-Voice-Design • VoiceClone: http://hf.co/spaces/Qwen/Qwen-TTS-Clone-Demo http://modelscope.cn/studios/Qwen/Qwen-TTS-Clone-Demo @ai_machinelearning_big_data #AI#TTS#voicecloning
Hashtags
@libreware · Post #1544 · 12.02.2026 г., 07:09
anx-reader Anx Reader is an advanced e-reader designed for book lovers, providing intelligent and focused reading. It supports various #ebook formats, including EPUB, MOBI, AZW3, FB2, TXT, and PDF, and offers powerful AI features such as shelf organization by progress and tone, mind map generation for deep understanding, a built-in dictionary and translator, perspective analysis, and summary generation. #TTS The program offers cross-platform syncing across Android, iOS, macOS, and Windows devices, allowing you to sync books, notes, and reading progress via WebDAV. Additional features include customizable reading settings (font size and style, line spacing, themes), a workspace for notes with export options, and reading stats tracking with habit visualization. Lang: Dart https://github.com/Anxcye/anx-reader Via @open_source_friend
@appmew · Post #16881 · 07.04.2026 г., 01:55
CloneTTS:安卓本地离线音色克隆与系统级 TTS 引擎。3 秒样本即可复刻专属人声,不需要联网 🏷标签:#安卓#TTS#声音克隆 ☁链接:点击获取 ⭐频道😮群聊✏投稿🌍中文