TGTGInsighttelegram intelligenceLIVE / telegram public index

← Midjourney/Nano Banana Prompts NeuroSpark

TGINSIGHT SIMILAR POSTS

Trouver du contenu similaire

Chaîne source @Shutter · Post #4607 · 22 mai

Voir le post Voir l'original

Harbor, cargo port, ships #AI#artificial_Intelligence

Hashtags

#ai #artificial_intelligence

Résultats

10,064 posts similaires trouvés

Recherche globale générale

AI一线｜ShareCentre

@ShareCentre · Post #7142 · 30/03/2026 16:08

Trouver des similaires Voir

🤖 阿里通义千问发布 Qwen3.5-Omni：全模态大模型三型齐发，215 项基准达到 SOTA 阿里巴巴通义千问团队于 3 月 29 日正式发布 Qwen3.5-Omni，这是其最新一代原生全模态大模型，支持文本、图像、音频和音视频的理解与生成。系列包含 Plus、Flash、Light 三个尺寸的 Instruct 版本，均支持 256k 长上下文输入。模型已通过 Offline API 和 Realtime API 开放使用。 📌 核心能力 - 架构：延续 Thinker-Talker 架构，升级为 Hybrid-Attention MoE 骨架 - 上下文窗口：256k（从 Qwen3-Omni 的 32k 大幅提升） - 输入能力：支持超 10 小时音频输入、400 秒 720P 音视频输入（1FPS） - 预训练数据：超过 1 亿小时音视频数据的原生全模态预训练 - Plus 在 215 个音频和音视频理解/推理/交互子任务上达到 SOTA ⚙️ 关键技术 - ARIA（Adaptive Rate Interleave Alignment）：动态对齐文本和语音单元，解决流式语音交互中数字漏读、发音不清等稳定性问题 - 语义中断：基于原生 turn-taking 意图识别，避免无意义背景噪声和反馈音打断对话 - 原生 WebSearch 和 FunctionCall：模型自主决定是否调用搜索回应实时问题 - 端到端语音控制：音量、语速、情绪均可通过语音指令调控 - 语音克隆：用户上传音色即可自定义 AI 助手声音 - 音视频字幕：可生成可控的、结构化的细粒度描述，包括自动分段、时间戳标注和角色关系描述 📊 性能亮点 - 音频：Plus 全面超越 Gemini-3.1 Pro（通用音频理解、推理、识别、翻译和对话） - 音视频：Plus 整体达到 Gemini-3.1 Pro 水平（VideoMME with audio: 83.7 vs 89.0） - 视觉和文本：与同规模 Qwen3.5 模型持平（MMLU-Pro 85.9、GPQA 83.9） - 语音生成稳定性 WER↓：Seed-hard 6.24（vs ElevenLabs 27.70、Gemini-2.5 Pro 11.57、GPT-Audio 8.19、Minimax 8.62） - 语音克隆相似度：20 语种均值 0.79（vs ElevenLabs 0.65、Minimax 0.76） - 新兴能力：Audio-Visual Vibe Coding —— 直接基于音视频指令进行编码 🌍 多语言覆盖 - 语音识别：113 种语言/方言（74 种国际语言 + 39 种中国方言） - 语音合成：36 种语言/方言（29 种国际语言 + 7 种中国方言） - 中国方言支持：从 Qwen3-Omni 的 8 种扩展到 39 种，覆盖粤语、闽南语、客家话、吴语、湘语、赣语等主要方言区 🔄 vs Qwen3-Omni 主要升级 - 骨架：MoE → Hybrid-MoE - 上下文：32k → 256k - 新增能力：音视频字幕、语义中断、WebSearch/Tool、语音控制、语音克隆 - 多语言：语音识别 11 → 113 种，语音合成 11 → 36 种 - Talker 架构：双轨自回归 → ARIA 交错对齐 📎 背景 - Qwen3.5 系列于 2 月 15 日发布旗舰文本模型 Qwen3.5-397B-A17B（开源权重），强调原生多模态和 Agent 能力 - 阿里持续加码 AI 基础设施投入，Qwen 系列已覆盖文本、视觉、全模态三条产品线 - 竞品动态：Google 于 3/26 发布 Gemini 3.1 Flash Live（ComplexFuncBench Audio 90.8%，语音 Agent 标杆）；小米 MiMo-V2-Omni 音频理解超 Gemini 3 Pro、图像理解超 Opus 4.6；OpenAI GPT-4o Advanced Voice Mode 仍为实时语音对话主流方案 - Qwen3.5-Omni-Plus 在音频维度全面超越 Gemini-3.1 Pro，标志阿里在全模态赛道对 Google 形成正面竞争 🔗 链接博客原文：https://qwen.ai/blog?id=qwen3.5-omni Offline API：https://www.alibabacloud.com/help/en/model-studio/qwen-omni Realtime API：https://www.alibabacloud.com/help/en/model-studio/realtime #AI#通义千问#全模态模型

Hashtags

#ai #通义千问 #全模态模型

折腾实验室频道

@TossLabChannel · Post #570 · 04/02/2025 02:33

Trouver des similaires Voir

#AI#纹身设计#Tattooer Tattooer：AI 驱动的个性化纹身设计 Tattooer 是一个 AI 生成纹身设计的平台，用户只需输入想要的纹身描述并选择风格，即可生成高质量的个性化设计。平台支持多种风格，如传统、极简、几何、日本风等，并提供高清图片下载，方便直接用于纹身创作。订阅计划起价 $6.99/月，适用于个人用户和专业纹身工作室。 📢 群聊: @TossLab 🎈 频道: @TossLabChannel ❗️ ❗️ ❗️ ❗️ ❗️ ❗️ ❗️ ❗️ 🔘折腾系列频道 - 全面介绍 🔘境外离岸银行教程合集目录 🔘折腾实验室优质Github项目合集 🔘大流量卡三大运营商推荐合作店铺

Hashtags

#ai #纹身设计 #tattooer

折腾实验室频道

@TossLabChannel · Post #564 · 03/02/2025 02:31

Trouver des similaires Voir

#AI#红包封面生成#AICover AI Cover：基于 AI 的微信红包封面生成工具 AI Cover 是一个开源项目，利用 AI 技术生成精美的微信红包封面。支持在线体验，并提供完整的本地部署指南，包括环境变量配置、数据库初始化（PostgreSQL）、依赖安装等。项目采用 Next.js、Clerk、AWS S3、Stripe 等技术构建，适用于开发者和设计爱好者。 📢 群聊: @TossLab 🎈 频道: @TossLabChannel ❗️ ❗️ ❗️ ❗️ ❗️ ❗️ ❗️ ❗️ 🔘折腾系列频道 - 全面介绍 🔘境外离岸银行教程合集目录 🔘折腾实验室优质Github项目合集 🔘大流量卡三大运营商推荐合作店铺

Hashtags

#ai #红包封面生成 #aicover

Google Drive 资源 | New @gdurl

@Gdsharing · Post #9777 · 31/01/2026 02:06

Trouver des similaires Voir

ada: Name: AI课程合集，零基础入门到实战精通，大V们都在偷偷学 Size: 124.1GB 涵盖机器学习、深度学习、自然语言处理等多个领域。课程内容包括基础理论、常用算法和实际应用，帮助学习者 ... Link: 👉Press me and click START to get the hidden link #自学#AI课程#合集#付费资源#学习#AI#quark#求转存 ♾@gdsharing♾资源分享不易：欢迎点赞支持分享者 #1 k: j 💬

Hashtags

#自学 #ai课程 #合集 #付费资源 #学习 #ai #quark #求转存

Sliverkissの废弃文化研究所

@sliverkiss_blog · Post #442 · 02/02/2026 03:08

Trouver des similaires Voir

开启 Gemini in Chrome 的方法 https://www.usmacd.com/cn/gemini_in_chrome #Gemini#Chrome#人工智能#浏览器#AI

Hashtags

#gemini #chrome #人工智能 #浏览器 #ai

Google Drive 资源 | New @gdurl

@Gdsharing · Post #9846 · 08/03/2026 14:03

Trouver des similaires Voir

浮光絮语: Name: 2026年新人0门槛部署OpenClaw（Clawdbot）快速极简部署教程 Size: 31.7MB 爆火的AI 自动化神器！本地部署Clawdbot，无需复杂的技术操作，仅需三步，即可快速拥有一款属于自己的AI自动化助理，实现任务拆解、工具调用、定时执行等功能 Link: 👉Press me and click START to get the hidden link #教程#OpenClaw#Clawdbot#AI#AI自动化助理#Quark#求转存 ♾@gdsharing♾Telegram/电报/纸飞机的网页端：可能无法点击链接 #1 Neal: 这教程是上个世纪的吧 💬 #2 袍: 哭悲

Hashtags

#教程 #openclaw #clawdbot #ai #ai自动化助理 #quark #求转存

科技&趣闻&杂记

@kejiqu · Post #3641 · 17/07/2025 06:58

Trouver des similaires Voir

新研究指出人类语言被 AI 影响，日常交流更频繁出现“GPT 词汇” Android Headline 报道称，最新研究表明，以 ChatGPT 为代表的 AI 聊天机器人，在模仿人类语言的同时，也影响人类在日常交流中使用更多 AI 口吻的词汇。德国马克斯・普朗克人类发展研究所的研究人员发现，人类口头语言在 AI 影响下，正发生微妙变化，更频繁地使用“GPT 词汇”，例如“深入研究”或“细致”。研究团队将数百万篇人类写作输入 ChatGPT，并让其“润色”文本，识别出 AI 偏好的词汇。研究人员追踪了这些词汇在 ChatGPT 发布前后 36 万段 YouTube 视频和 77.1 万个播客节目中的使用频率，结果显示，这些“GPT 词汇”在英语口语中变得更加突出。IT之家 🏷#AI#语言#ChatGPT 📢频道👥群组📝投稿

Hashtags

#ai #语言 #chatgpt

Александр Черевков - Аранжировка, Биты, Сведение, Гитары

@alexandercherevkov · Post #384 · 26/07/2025 13:59

Trouver des similaires Voir

ИИ-музыка и авторское право: Orfium получил €7.5 млн на исследование 🤖💸 Технологическая компания Orfium, которая занимается управлением музыкальными правами, получила крупный грант от Евросоюза. Денежки пойдут на то, чтобы разобраться, как находить куски защищенной авторским правом музыки в треках, созданных с помощью нейросетей. Проще говоря: ИИ может нагенерить трек, но «вдохновиться» уже существующей музыкой, а оригинальный автор останется без копейки. Orfium будет разрабатывать технологию, чтобы отслеживать такие случаи и обеспечивать выплаты настоящим авторам и правообладателям 💰 Проект называется AIXPERT, и вот его ключевые моменты: ▫️Сумма гранта. €7.5 миллионов. ▫️Срок исследования. 3 года. ▫️Главная цель. Создать ИИ-системы, которые смогут точно определять, когда и как ИИ-музыка использует элементы уже существующих треков. Актуальность просто зашкаливает. По данным CISAC, рынок генеративной ИИ-музыки может вырасти с €3 млрд до €64 млрд к 2028 году. Так что правила игры нужно определять уже сейчас. Orfium будет работать в консорциуме с европейскими учреждениями, включая Университет Сорбонны, Афинский исследовательский центр и Барселонский центр суперкомпьютеров. В основе проекта лежат так называемые FATE-принципы (справедливость, подотчётность, прозрачность и этичность). Идея в том, чтобы создать ИИ, которому можно доверять и который может «объяснять» свои решения на понятном человеку языке. По сути, это попытка создать фреймворк для регулирования авторских прав, лицензирования и монетизации в новую эпоху ИИ, чтобы авторы песен и композиторы не остались за бортом. Как думаете, смогут ли такие ИИ-детекторы реально защитить права авторов? Или нас ждет дикий запад с ИИ-музыкой? #AI#ИИ#авторскоеправо#Orfium#музыкальнаяиндустрия#генеративнаямузыка#технологии#AIXPERT#музыкальныеправа

Hashtags

#ai #ии #авторскоеправо #orfium #музыкальнаяиндустрия #генеративнаямузыка #технологии #aixpert #музыкальныеправа

喬苑

@Qiao_blog · Post #930 · 03/12/2024 12:09

Trouver des similaires Voir

1、TTS - 文本转语音地址：https://www.text-to-speech.cn 2、海豚AI 地址：https://www.ttson.cn 3、免费文字转语音地址：https://zh-cn.text-to-speech.online 4、TTSMAKER 地址：https://ttsmaker.cn 5、文字转语音地址：https://d1tools.com/tools/ai-tts/ 6、AivisSpeech：AI声音模仿系统，实现文本到语音的转换地址：https://github.com/Aivis-Project/AivisSpeech 7、谷歌开发的一款AI工具，可以把文本生成男女对话式音频，增加趣味性，对英语学习或是枯燥的文本阅读很有帮助地址：https://notebooklm.google.com/ 8、Fish Audio：免费生成式 AI 文本转语音和语音克隆工具地址：https://fish.audio/zh-CN/ 9、MeloTTS - MyShell 提供的高质量多语言文本转语音工具地址：https://github.com/myshell-ai/MeloTTS 地址：https://huggingface.co/spaces/mrfakename/MeloTTS 地址：https://github.com/myshell-ai/MeloTTS 10、两个AI语音转文本工具 AudioNotes AI：语音转文本工具并转化为清晰的文本笔记地址：https://github.com/harry0703/AudioNotes AudioNotes AI 地址：https://audionotes.ai/ #AI#工具#语音转文本#文本转语音 💻💻 关注频道：@onesees

Hashtags

#ai #工具 #语音转文本 #文本转语音

NEWS 鏈新聞-ABMedia

@abmedia_news · Post #24453 · 08/05/2026 06:00

Trouver des similaires Voir

【🤖 AI 人工智慧｜OpenAI Codex 推 Chrome 擴充：可在瀏覽器測試 web app、跨頁取 context、平行運作】 #AI#Agent#Codex#Chrome 該公司於 5 月 7 日發布支援雙系統的編碼功能，是將 AI Agent 從 IDE 走向瀏覽器的具體一步。工具在不接管瀏覽器的情況下能同步處理任務，帶動週活躍用戶超過 400 萬人，較年初成長 8 倍。對照 Anthropic 揭露 Q1 算力短缺，Codex 與 Claude Code 正同步迎來需求爆發。 📍閱讀全文： https://abmedia.io/openai-codex-chrome-extension-browser-may-2026 📍 訂閱鏈新聞頻道：https://linktr.ee/abmedia.io

Hashtags

#ai #agent #codex #chrome

Data Science Jobs

@datasciencejobs · Post #1846 · 22/12/2023 10:11

Trouver des similaires Voir

#вакансия#cv#resume#ai#ml#iot#senior#lead Ребята, добрый вечер. На текущий момент, мы находимся в поисках AI/ML Lead на один из крутейших проектов нашего партнера. Наш партнер — ИТ- компания, создающая продукты для промышленного сектора (IoT). Вакансия: AI/ML Lead Формат работы: удаленно Формат трудоустройства: ТК РФ / сервисный контракт Локация: РФ, Армения, Казахстан, Беларусь, ОАЭ Занятость: полная Команда: front (vue.js)/backend, PM, QA's Методология: Agile (Scrum) Вилка: 350-500к (gross) Требуемые навыки и квалификация: - 5+ лет опыта в области искусственного интеллекта и машинного обучения; - Опыт руководства и управления техническими командами; - Отличные навыки решения проблем и аналитические способности; - Знакомство с IoT и его применением в крупномасштабных операциях. Ключевые обязанности: - Подбор и управление командой экспертов по AI/ML; - Контроль разработки и внедрение решений на основе искусственного интеллекта в нашем программном обеспечении (IoT) - Взаимодействие с кросс функциональными командами для интеграции возможностей искусственного интеллекта в продукт; - Убедиться, что функции искусственного интеллекта ПО соответствуют конкретным потребностям горнодобывающей промышленности; - Быть в курсе последних тенденций и достижений в области искусственного интеллекта и машинного обучения. Требования к образованию: - Степень бакалавра в области компьютерных наук, искусственного интеллекта, машинного обучения или смежных областях. Учёные степени являются предпочтительными. Будет плюсом: - Обширный опыт в области AI/ML с упором на имплементацию промышленных продуктов; - Опыт работы в горнодобывающей отрасли Контакты: tg: Sergei_APS email: [email protected]

Hashtags

#вакансия #cv #resume #ai #ml #iot #senior #lead

APP喵-软件资源共享

@appmew · Post #14919 · 25/10/2025 01:28

Trouver des similaires Voir

FireRedTTS-2 – 面向播客和聊天机器人的AI长对话语音生成亮点🔥 长对话语音生成：目前支持 4 位说话者的 3 分钟对话，并且可以通过扩展训练语料库轻松扩展到更多说话者的更长对话。多语言支持：支持英语、中文、日语、韩语、法语、德语、俄语等多种语言。支持零样本语音克隆，适用于跨语言和代码切换场景。超低延迟：基于新的12.5Hz 流式语音标记器，我们采用了双变压器架构，该架构在文本语音交错序列上运行，从而实现了灵活的逐句生成并减少了首包延迟。具体而言，在 L20 GPU 上，我们的首包延迟低至 140ms，同时保持高质量的音频输出。强稳定性：我们的模型在独白和对话测试中都实现了高相似度和低WER/CER。随机音色生成：用于创建 ASR/语音交互数据。 🏷标签：#TTS#AI#语音生成#源码 ☁链接：点击获取 ⭐频道😮群聊✏投稿🌍中文

Hashtags

#tts #ai #语音生成 #源码

1 2•••50•••100•••150•••200•••250•••300•••350•••400•••450•••500•••540 541542543 544•••550•••600•••650•••700•••750•••800•••838 839

← PrécédentPage 542 sur 839Suivant →