TGTGInsighttelegram intelligenceLIVE / telegram public index
← Midjourney/Nano Banana Prompts NeuroSpark

TGINSIGHT SIMILAR POSTS

Trouver du contenu similaire

Chaîne source @Shutter · Post #4607 · 22 mai

Harbor, cargo port, ships #AI#artificial_Intelligence

Résultats

10,064 posts similaires trouvés

Recherche globale générale

AI一线|ShareCentre

@ShareCentre · Post #7142 · 30/03/2026 16:08

🤖 阿里通义千问发布 Qwen3.5-Omni:全模态大模型三型齐发,215 项基准达到 SOTA 阿里巴巴通义千问团队于 3 月 29 日正式发布 Qwen3.5-Omni,这是其最新一代原生全模态大模型,支持文本、图像、音频和音视频的理解与生成。系列包含 Plus、Flash、Light 三个尺寸的 Instruct 版本,均支持 256k 长上下文输入。模型已通过 Offline API 和 Realtime API 开放使用。 📌 核心能力 - 架构:延续 Thinker-Talker 架构,升级为 Hybrid-Attention MoE 骨架 - 上下文窗口:256k(从 Qwen3-Omni 的 32k 大幅提升) - 输入能力:支持超 10 小时音频输入、400 秒 720P 音视频输入(1FPS) - 预训练数据:超过 1 亿小时音视频数据的原生全模态预训练 - Plus 在 215 个音频和音视频理解/推理/交互子任务上达到 SOTA ⚙️ 关键技术 - ARIA(Adaptive Rate Interleave Alignment):动态对齐文本和语音单元,解决流式语音交互中数字漏读、发音不清等稳定性问题 - 语义中断:基于原生 turn-taking 意图识别,避免无意义背景噪声和反馈音打断对话 - 原生 WebSearch 和 FunctionCall:模型自主决定是否调用搜索回应实时问题 - 端到端语音控制:音量、语速、情绪均可通过语音指令调控 - 语音克隆:用户上传音色即可自定义 AI 助手声音 - 音视频字幕:可生成可控的、结构化的细粒度描述,包括自动分段、时间戳标注和角色关系描述 📊 性能亮点 - 音频:Plus 全面超越 Gemini-3.1 Pro(通用音频理解、推理、识别、翻译和对话) - 音视频:Plus 整体达到 Gemini-3.1 Pro 水平(VideoMME with audio: 83.7 vs 89.0) - 视觉和文本:与同规模 Qwen3.5 模型持平(MMLU-Pro 85.9、GPQA 83.9) - 语音生成稳定性 WER↓:Seed-hard 6.24(vs ElevenLabs 27.70、Gemini-2.5 Pro 11.57、GPT-Audio 8.19、Minimax 8.62) - 语音克隆相似度:20 语种均值 0.79(vs ElevenLabs 0.65、Minimax 0.76) - 新兴能力:Audio-Visual Vibe Coding —— 直接基于音视频指令进行编码 🌍 多语言覆盖 - 语音识别:113 种语言/方言(74 种国际语言 + 39 种中国方言) - 语音合成:36 种语言/方言(29 种国际语言 + 7 种中国方言) - 中国方言支持:从 Qwen3-Omni 的 8 种扩展到 39 种,覆盖粤语、闽南语、客家话、吴语、湘语、赣语等主要方言区 🔄 vs Qwen3-Omni 主要升级 - 骨架:MoE → Hybrid-MoE - 上下文:32k → 256k - 新增能力:音视频字幕、语义中断、WebSearch/Tool、语音控制、语音克隆 - 多语言:语音识别 11 → 113 种,语音合成 11 → 36 种 - Talker 架构:双轨自回归 → ARIA 交错对齐 📎 背景 - Qwen3.5 系列于 2 月 15 日发布旗舰文本模型 Qwen3.5-397B-A17B(开源权重),强调原生多模态和 Agent 能力 - 阿里持续加码 AI 基础设施投入,Qwen 系列已覆盖文本、视觉、全模态三条产品线 - 竞品动态:Google 于 3/26 发布 Gemini 3.1 Flash Live(ComplexFuncBench Audio 90.8%,语音 Agent 标杆);小米 MiMo-V2-Omni 音频理解超 Gemini 3 Pro、图像理解超 Opus 4.6;OpenAI GPT-4o Advanced Voice Mode 仍为实时语音对话主流方案 - Qwen3.5-Omni-Plus 在音频维度全面超越 Gemini-3.1 Pro,标志阿里在全模态赛道对 Google 形成正面竞争 🔗 链接 博客原文:https://qwen.ai/blog?id=qwen3.5-omni Offline API:https://www.alibabacloud.com/help/en/model-studio/qwen-omni Realtime API:https://www.alibabacloud.com/help/en/model-studio/realtime #AI#通义千问#全模态模型

折腾实验室频道

@TossLabChannel · Post #570 · 04/02/2025 02:33

#AI#纹身设计#Tattooer Tattooer:AI 驱动的个性化纹身设计 Tattooer 是一个 AI 生成纹身设计的平台,用户只需输入想要的纹身描述并选择风格,即可生成高质量的个性化设计。 平台支持多种风格,如传统、极简、几何、日本风等,并提供高清图片下载,方便直接用于纹身创作。 订阅计划起价 $6.99/月,适用于个人用户和专业纹身工作室。 📢 群聊: @TossLab 🎈 频道: @TossLabChannel ❗️ ❗️ ❗️ ❗️ ❗️ ❗️ ❗️ ❗️ 🔘折腾系列频道 - 全面介绍 🔘境外离岸银行教程合集目录 🔘折腾实验室优质Github项目合集 🔘大流量卡三大运营商推荐合作店铺

折腾实验室频道

@TossLabChannel · Post #564 · 03/02/2025 02:31

#AI#红包封面生成#AICover AI Cover:基于 AI 的微信红包封面生成工具 AI Cover 是一个开源项目,利用 AI 技术生成精美的微信红包封面。 支持在线体验,并提供完整的本地部署指南,包括环境变量配置、数据库初始化(PostgreSQL)、依赖安装等。 项目采用 Next.js、Clerk、AWS S3、Stripe 等技术构建,适用于开发者和设计爱好者。 📢 群聊: @TossLab 🎈 频道: @TossLabChannel ❗️ ❗️ ❗️ ❗️ ❗️ ❗️ ❗️ ❗️ 🔘折腾系列频道 - 全面介绍 🔘境外离岸银行教程合集目录 🔘折腾实验室优质Github项目合集 🔘大流量卡三大运营商推荐合作店铺

Google Drive 资源 | New @gdurl

@Gdsharing · Post #9777 · 31/01/2026 02:06

ada: Name: AI课程合集,零基础入门到实战精通,大V们都在偷偷学 Size: 124.1GB 涵盖机器学习、深度学习、自然语言处理等多个领域。课程内容包括基础理论、常用算法和实际应用,帮助学习者 ... Link: 👉Press me and click START to get the hidden link #自学#AI课程#合集#付费资源#学习#AI#quark#求转存 ♾@gdsharing♾资源分享不易:欢迎点赞支持分享者 #1 k: j 💬

Google Drive 资源 | New @gdurl

@Gdsharing · Post #9846 · 08/03/2026 14:03

浮光絮语: Name: 2026年新人0门槛部署OpenClaw(Clawdbot)快速极简部署教程 Size: 31.7MB 爆火的AI 自动化神器!本地部署Clawdbot,无需复杂的技术操作,仅需三步,即可快速拥有一款属于自己的AI自动化助理,实现任务拆解、工具调用、定时执行等功能 Link: 👉Press me and click START to get the hidden link #教程#OpenClaw#Clawdbot#AI#AI自动化助理#Quark#求转存 ♾@gdsharing♾Telegram/电报/纸飞机的网页端:可能无法点击链接 #1 Neal: 这教程是上个世纪的吧 💬 #2 袍: 哭悲

科技&趣闻&杂记

@kejiqu · Post #3641 · 17/07/2025 06:58

新研究指出人类语言被 AI 影响,日常交流更频繁出现“GPT 词汇” Android Headline 报道称,最新研究表明,以 ChatGPT 为代表的 AI 聊天机器人,在模仿人类语言的同时,也影响人类在日常交流中使用更多 AI 口吻的词汇。德国马克斯・普朗克人类发展研究所的研究人员发现,人类口头语言在 AI 影响下,正发生微妙变化,更频繁地使用“GPT 词汇”,例如“深入研究”或“细致”。研究团队将数百万篇人类写作输入 ChatGPT,并让其“润色”文本,识别出 AI 偏好的词汇。研究人员追踪了这些词汇在 ChatGPT 发布前后 36 万段 YouTube 视频和 77.1 万个播客节目中的使用频率,结果显示,这些“GPT 词汇”在英语口语中变得更加突出。IT之家 🏷#AI#语言#ChatGPT 📢频道👥群组📝投稿

ИИ-музыка и авторское право: Orfium получил €7.5 млн на исследование 🤖💸 Технологическая компания Orfium, которая занимается управлением музыкальными правами, получила крупный грант от Евросоюза. Денежки пойдут на то, чтобы разобраться, как находить куски защищенной авторским правом музыки в треках, созданных с помощью нейросетей. Проще говоря: ИИ может нагенерить трек, но «вдохновиться» уже существующей музыкой, а оригинальный автор останется без копейки. Orfium будет разрабатывать технологию, чтобы отслеживать такие случаи и обеспечивать выплаты настоящим авторам и правообладателям 💰 Проект называется AIXPERT, и вот его ключевые моменты: ▫️Сумма гранта. €7.5 миллионов. ▫️Срок исследования. 3 года. ▫️Главная цель. Создать ИИ-системы, которые смогут точно определять, когда и как ИИ-музыка использует элементы уже существующих треков. Актуальность просто зашкаливает. По данным CISAC, рынок генеративной ИИ-музыки может вырасти с €3 млрд до €64 млрд к 2028 году. Так что правила игры нужно определять уже сейчас. Orfium будет работать в консорциуме с европейскими учреждениями, включая Университет Сорбонны, Афинский исследовательский центр и Барселонский центр суперкомпьютеров. В основе проекта лежат так называемые FATE-принципы (справедливость, подотчётность, прозрачность и этичность). Идея в том, чтобы создать ИИ, которому можно доверять и который может «объяснять» свои решения на понятном человеку языке. По сути, это попытка создать фреймворк для регулирования авторских прав, лицензирования и монетизации в новую эпоху ИИ, чтобы авторы песен и композиторы не остались за бортом. Как думаете, смогут ли такие ИИ-детекторы реально защитить права авторов? Или нас ждет дикий запад с ИИ-музыкой? #AI#ИИ#авторскоеправо#Orfium#музыкальнаяиндустрия#генеративнаямузыка#технологии#AIXPERT#музыкальныеправа

喬苑

@Qiao_blog · Post #930 · 03/12/2024 12:09

1、TTS - 文本转语音 地址:https://www.text-to-speech.cn 2、海豚AI 地址:https://www.ttson.cn 3、免费文字转语音 地址:https://zh-cn.text-to-speech.online 4、TTSMAKER 地址:https://ttsmaker.cn 5、文字转语音 地址:https://d1tools.com/tools/ai-tts/ 6、AivisSpeech:AI声音模仿系统,实现文本到语音的转换 地址:https://github.com/Aivis-Project/AivisSpeech 7、谷歌开发的一款AI工具,可以把文本生成男女对话式音频,增加趣味性,对英语学习或是枯燥的文本阅读很有帮助 地址:https://notebooklm.google.com/ 8、Fish Audio:免费生成式 AI 文本转语音和语音克隆工具 地址:https://fish.audio/zh-CN/ 9、MeloTTS - MyShell 提供的高质量多语言文本转语音工具 地址:https://github.com/myshell-ai/MeloTTS 地址:https://huggingface.co/spaces/mrfakename/MeloTTS 地址:https://github.com/myshell-ai/MeloTTS 10、两个AI语音转文本工具 AudioNotes AI:语音转文本工具 并转化为清晰的文本笔记 地址:https://github.com/harry0703/AudioNotes AudioNotes AI 地址:https://audionotes.ai/ #AI#工具#语音转文本#文本转语音 💻💻 关注频道:@onesees

NEWS 鏈新聞-ABMedia

@abmedia_news · Post #24453 · 08/05/2026 06:00

【🤖 AI 人工智慧|OpenAI Codex 推 Chrome 擴充:可在瀏覽器測試 web app、跨頁取 context、平行運作】 #AI#Agent#Codex#Chrome 該公司於 5 月 7 日發布支援雙系統的編碼功能,是將 AI Agent 從 IDE 走向瀏覽器的具體一步。 工具在不接管瀏覽器的情況下能同步處理任務,帶動週活躍用戶超過 400 萬人,較年初成長 8 倍。對照 Anthropic 揭露 Q1 算力短缺,Codex 與 Claude Code 正同步迎來需求爆發。 📍閱讀全文: https://abmedia.io/openai-codex-chrome-extension-browser-may-2026 📍 訂閱鏈新聞頻道:https://linktr.ee/abmedia.io

Data Science Jobs

@datasciencejobs · Post #1846 · 22/12/2023 10:11

#вакансия#cv#resume#ai#ml#iot#senior#lead Ребята, добрый вечер. На текущий момент, мы находимся в поисках AI/ML Lead на один из крутейших проектов нашего партнера. Наш партнер — ИТ- компания, создающая продукты для промышленного сектора (IoT). Вакансия: AI/ML Lead Формат работы: удаленно Формат трудоустройства: ТК РФ / сервисный контракт Локация: РФ, Армения, Казахстан, Беларусь, ОАЭ Занятость: полная Команда: front (vue.js)/backend, PM, QA's Методология: Agile (Scrum) Вилка: 350-500к (gross) Требуемые навыки и квалификация: - 5+ лет опыта в области искусственного интеллекта и машинного обучения; - Опыт руководства и управления техническими командами; - Отличные навыки решения проблем и аналитические способности; - Знакомство с IoT и его применением в крупномасштабных операциях. Ключевые обязанности: - Подбор и управление командой экспертов по AI/ML; - Контроль разработки и внедрение решений на основе искусственного интеллекта в нашем программном обеспечении (IoT) - Взаимодействие с кросс функциональными командами для интеграции возможностей искусственного интеллекта в продукт; - Убедиться, что функции искусственного интеллекта ПО соответствуют конкретным потребностям горнодобывающей промышленности; - Быть в курсе последних тенденций и достижений в области искусственного интеллекта и машинного обучения. Требования к образованию: - Степень бакалавра в области компьютерных наук, искусственного интеллекта, машинного обучения или смежных областях. Учёные степени являются предпочтительными. Будет плюсом: - Обширный опыт в области AI/ML с упором на имплементацию промышленных продуктов; - Опыт работы в горнодобывающей отрасли Контакты: tg: Sergei_APS email: [email protected]

APP喵-软件资源共享

@appmew · Post #14919 · 25/10/2025 01:28

FireRedTTS-2 – 面向播客和聊天机器人的AI长对话语音生成 亮点🔥 长对话语音生成:目前支持 4 位说话者的 3 分钟对话,并且可以通过扩展训练语料库轻松扩展到更多说话者的更长对话。 多语言支持:支持英语、中文、日语、韩语、法语、德语、俄语等多种语言。支持零样本语音克隆,适用于跨语言和代码切换场景。 超低延迟:基于新的12.5Hz 流式语音标记器,我们采用了双变压器架构,该架构在文本语音交错序列上运行,从而实现了灵活的逐句生成并减少了首包延迟。具体而言,在 L20 GPU 上,我们的首包延迟低至 140ms,同时保持高质量的音频输出。 强稳定性:我们的模型在独白和对话测试中都实现了高相似度和低WER/CER。 随机音色生成:用于创建 ASR/语音交互数据。 🏷标签:#TTS#AI#语音生成#源码 ☁链接:点击获取 ⭐频道😮群聊✏投稿🌍中文

12•••50•••100•••150•••200•••250•••300•••350•••400•••450•••500•••540541542543544•••550•••600•••650•••700•••750•••800•••838839