TGTGInsightаналитика telegramLIVE / telegram public index

TGINSIGHT SIMILAR POSTS

Найти похожее

Источник @procode404 · Post #3988 · 19 мар.

🔥Как работает нейросеть? — [9:59] Нейросети уже заполонили мир, особенно ChatGPT и Midjourney, поэтому важно приблизительно понимать как они работают. В этом ролике речь пойдёт об общем строении ИИ, что такое нейрон, вес и как подбирается результат. Перейти к просмотру #видео#ai

Hashtags

#видео #ai

Результаты

Найдено 11,663 похожих постов

Общий глобальный поиск

AI一线｜ShareCentre

@ShareCentre · Post #7220 · 21.04.2026, 01:39

Похожие Смотреть

Google AI 订阅者解锁 AI Studio 高级权益：Pro/Ultra 直通 Nano Banana Pro 与 Gemini Pro Google 于 4 月 20 日宣布，Google AI Pro 与 Google AI Ultra 订阅用户即日起可在 Google AI Studio 中获得更高的使用额度，并直接访问 Nano Banana Pro（基于 Gemini 3 Pro 的图像生成模型）与 Gemini Pro 系列模型。对于已用完免费额度的开发者，Google AI 订阅计划现在成为一条低门槛的「计费通道」，让原型与实验阶段的开发者无需单独配置 API 密钥即可在 AI Studio 中继续构建。当应用准备上线时，可在 AI Studio 内一键切换到按量付费的 API 密钥设置。 ⚙️ 关键变化 - Google AI Pro/Ultra 订阅覆盖 AI Studio 使用额度，不再挤占 Gemini App 的配额 - 订阅直通 Nano Banana Pro 和 Gemini Pro 模型，开发者开箱即用 - 官方明确两条路径：订阅做原型与深度实验，API 做生产级部署 - 从订阅切换到 API 可在 AI Studio 内顺畅完成 - 即日起面向所有 AI Pro 和 Ultra 订阅者滚动发布，需用已关联账户登录 💰 订阅档位速览 - Google AI Pro：约 $20/月，含 Gemini 3.1 Pro、5TB 存储、Veo 3.1 Lite 有限体验、Gemini in Gmail/Docs 等 - Google AI Ultra：$249.99/月（前三个月促销价 $124.99），含 3.1 Pro 最高额度、Veo 3.1 最高额度、Deep Think、Gemini Agent（仅美区）、Antigravity 最高速率、30TB 存储、YouTube Premium 🔙 背景 - AI Studio 从 Gemini API 调试工具演进为全栈开发平台的转型进入第二阶段 - 3 月 19-20 日 Google AI Studio 整合 Firebase 后端能力，并接入 Antigravity 编程代理，从 prompt 到全栈应用一键成型；Firebase Studio 同步宣布 2027 年 3 月 22 日日落 - Nano Banana Pro 基于 Gemini 3 Pro，2025 年 11 月发布，主打高保真图像、精准文字渲染与世界知识，此前仅在 Ultra 等高端入口全额开放 - Google AI Pro/Ultra 是 2025 年 5 月将原 Google One AI Premium 重塑后的新订阅体系，Ultra 定位对标 ChatGPT Pro 与 Claude Max ⚔️ 竞品动态 - Anthropic：Claude Code 订阅用户可在 Max 套餐内获得高额 token（Max 20x $200/月），但 4 月 4 日起切断第三方工具订阅通道，强制进入 Usage Bundles 或 API 按量付费 - OpenAI：4 月 9 日新增 $100/月 ChatGPT Pro 档位，Codex 用量最高提升 10 倍；3 月 20 日向美加大学生赠送 $100 Codex 积分 - Cursor：3 月 Composer 2 自研模型发布，$2.50/M 输入 token 激进定价；4 月 2 日 Cursor 3（Glass）围绕智能体重构 IDE - Vercel v0、Bolt.new、Lovable、Replit 等 Vibe Coding 工具普遍采用订阅 + API 混合商业模式 📎 行业观察订阅 + AI Studio 的组合让 Google 在 AI 开发者入口上形成完整闭环：Gemini 订阅覆盖日常模型访问，AI Studio 覆盖原型与全栈构建，Antigravity 覆盖本地 Agent IDE，API 覆盖生产部署。与 Anthropic 通过订阅打包 Claude Code 的思路同源，但 Google 把路径梳理得更清晰——免费体验、订阅原型、API 生产三段式分明。订阅作为「低门槛计费通道」的定位，本质上是把 AI Studio 从纯开发者工具升级为付费用户留存工具；叠加 3 月的 Firebase + Antigravity 整合，Google AI 开发者漏斗的每一层都被订阅体系串了起来。 📌 来源 - 官方博客：https://blog.google/innovation-and-ai/technology/developers-tools/google-one-ai-studio/ - Google AI 订阅说明：https://one.google.com/about/google-ai-plans/ - 相关背景：AI Studio 整合 Firebase https://firebase.blog/posts/2026/03/announcing-ai-studio-integration #Google#AIStudio#Gemini#NanoBananaPro#VibeCoding#AI

Hashtags

#google #aistudio #gemini #nanobananapro #vibecoding #ai

秀儿の科技软件|资源分享社🎀

@JianjiaoPD · Post #9611 · 16.10.2025, 09:42

Похожие Смотреть

👥Everywhere | 真·懂你屏幕的 AI 助手来了这款开源桌面助手 Everywhere 有点神——它能自动感知屏幕内容，无需截图、复制或切换窗口，只要按下快捷键，AI 就能直接理解你当前看到的东西并给出答案。支持 OpenAI、Claude、Gemini 等模型，还能即时搜索网页、总结文章、翻译文本、润色邮件，堪称全能交互式 AI 助手它的毛玻璃界面极简又高级，支持 Markdown 渲染、上下文捕捉与屏幕语义理解。目前已支持 Windows 系统，下载安装后配置 API Key 即可使用 😎小编有话说:这大概是我见过最“聪明”的 AI 桌面助手了，连我在想啥它都先一步知道 🪙官网 👩‍💻GitHub · 🚀Releases下载标签：#Everywhere#AI#桌面#屏幕控制#电脑AI 🗓@xiuerSearch 搜索历史资源 ✈️频道 | 💬群聊 | 📱中文包

Hashtags

#everywhere #ai #桌面 #屏幕控制 #电脑ai

科技&趣闻&杂记

@kejiqu · Post #3627 · 11.07.2025, 08:21

Похожие Смотреть

Manus 清空国内多平台账号，前员工透露“不会继续推进”中文版 AI Agent平台Manus的官方微博和小红书账号内容已被清空。通过浏览器访问其官网，显示“Manus 在你所在的地区不可用”。此前有传言称Manus裁撤部分国内业务，并将核心技术人员迁往新加坡总部。官方回应称将对部分业务团队进行调整，以提升运营效率。今年3月，Manus曾宣布与阿里通义千问团队达成战略合作，基于通义千问系列开源模型实现Manus全部功能。但相关官宣微博已无法查看。蓝鲸新闻报道称，多位员工证实公司将迁往新加坡，不再保留国内业务团队，与通义千问的合作或将终止。IT之家 🏷#Manus#AI#Agent#裁员 📢频道👥群组📝投稿

Hashtags

#manus #ai #agent #裁员

科技&趣闻&杂记

@kejiqu · Post #3322 · 01.05.2025, 23:37

Похожие Смотреть

Cloudflare 推出 13 个新的 MCP 服务器，今日即可使用 Cloudflare 推出 13 个新的 MCP 服务器，旨在为用户提供更便捷的 AI 工具访问。这些服务器允许 MCP 客户端读取配置、处理信息、提供建议并执行操作，覆盖应用程序开发、安全性和性能等多个领域。 Cloudflare 还分享了构建 MCP 服务器的最佳实践，包括优化特定任务、专门化权限和使用评估测试。用户可以通过 claude.ai 设置或 mcp-remote 进行服务器连接。Cloudflare Blog 🏷#Cloudflare#MCP#服务器#AI 📢频道👥群组📝投稿

Hashtags

#cloudflare #mcp #服务器 #ai

Machinelearning

@ai_machinelearning_big_data · Post #9534 · 17.02.2026, 09:02

Похожие Смотреть

🌟BitDance: авторегрессионная генерация изображений с бинарными токенами. Генеративные модели делятся на 2 лагеря: диффузионные и авторегрессионные. Вторые концептуально ближе к LLM - генерируют изображение токен за токеном, как текст. Проблема в том, что это очень медленно, а качество проигрывает диффузии. BitDance - экспериментальная 14B AR-модель, которая пытается решить оба этих вопроса разом. Этим проектом группа китайских рисёчеров показала, что правильный бинарный токенизатор + diffusion head + параллельный патчинг закрывает большинство претензий. Они локализовали 3 проблемы дискретных AR-моделей и закрыли каждую отдельным решением. 🟡Плохая реконструкция токенизатора Вместо VQ-кодбука тут используется бинарный токенизатор на основе квантования с групповым разбиением каналов. Словарь вырастает до 2²⁵⁶ (для сравнения: у Cosmos - 65536), при этом модель держит PSNR 25.29 против 24.81 у непрерывного DC-AE, то есть бинарные токены реконструируют изображение лучше, чем VAE у SANA. 🟡Нестабильный сэмплинг А как вообще выбирать из словаря в 2²⁵⁶ вариантов? Обучить классификатор на все возможные токены тут не вариант: такой слой не поместится ни в какую память. В качестве решения - прикрутили diffusion head, которая моделирует биты на непрерывном гиперкубе. То есть, модель предсказывает структуру битов через velocity-matching, что и позволяет сэмплить из гигантского пространства состояний. 🟡Скорость AR генерирует по одному токену за шаг. BitDance за один шаг выдает сразу 64 токена (или 16), при этом модель понимает, как они связаны между собой внутри этого блока. Громко заявленный результат: 30x ускорение относительно next-token AR при сопоставимом качестве. об этом в конце 🟡Тесты На мелкой версии ImageNet BitDance-H достигает FID 1.24 (лучший результат среди AR-моделей, наравне с xAR-H). На DPG-Bench (text-to-image) полноценная BitDance набирает 88.28 - это выше FLUX.1-Dev, SD3, Janus-Pro, но уступает Seedream 3.0 и Qwen-Image. В релизе 2 версии 14B модели, с предикшеном на 16 и 64 токена и макс. разрешением 1Мpx. Остается вопрос: насколько бинарный токенизатор + diffusion head добавляет латентности на каждом шаге, даже если самих шагов стало меньше из-за патчинга. 30x по скорости - это сравнение не с диффузионными моделями, которые уже умеют генерировать за 4–8 шагов. 14B - это не про "взял и запустил". Есть конечно версии на ImageNet с разрешением 256х256 для воспроизведения эксперимента, но не за этим мы сюда пришли. 📌Лицензирование: Apache 2.0 License. 🟡Страница проекта 🟡Arxiv 🟡Модель 🟡Demo 🖥GitHub @ai_machinelearning_big_data #AI#ML#AR#T2I#BitDance

Hashtags

#ai #ml #ar #t2i #bitdance

耕读频道

@iGengdu · Post #503 · 27.08.2024, 12:59

Похожие Смотреть

#陶哲轩#数学#AI#辅助#CoT 分享一个视频：https://www.youtube.com/watch?v=e049IoFBnLA B站地址： https://bilibili.com/video/BV1kssseFE6X 视频内容为：陶哲轩（美籍华人，数学界最高荣誉、菲尔兹奖获得者）在IMO 2024暨65界国际数学奥林匹亚会议上的演讲主要内容： 1. 我们使用机器做数学计算已经有数千年，最早的机器辅助计算可能是罗马人，然后是中国的算盘 2. 二战时就有人肉“计算机”，计算弹道和其他任务，多位女孩子，因为男士们在打仗，所以那时候的计算基本单位不是GPU，而是kilogirl-hour——“千名女孩工作一小时的计算量” 3. 现在，数学家们使用一种现代化的证明辅助编程语言，叫做 Lean。在 Lean 中有一个核心的数学库，通过众包的方式开发的，本科数学课程中看到的内容，比如微积分基础、群论基础或者拓扑学等等，这些都已经被形式化了，所以你不用从公理开始。 4. 现在数学领域有一种团队协作证明复杂数学定理的工作流程，那就是先编写一个称为“蓝图”的详细证明计划，将整个证明分解为数百个小步骤。每个步骤可以单独形式化，然后再将它们整合在一起，这样你就可以将一个庞大的论证分解成许多小块。先编写这个蓝图，然后团队中的其他人可以对论据的不同步骤的不同部分进行形式化。去年，陶哲轩和几位同事一起解决了一个组合数学问题。这是一个组合学的问题。大约20人在短短三周内完成了，使用了蓝图工具，参与的人中有概率论专家，甚至还有一些并非数学家的人，他们是程序员，但在解决这些小型拼图问题上非常擅长。每个人都挑选了一个觉得自己能做的小任务，并完成了它。在数学领域，通常很难这么多人一起合作，一般最多可能五个人合作。因为在大项目上合作时，你必须相信每个人的数学都是正确的。但是，一旦超过一定规模，这就无法实现了。但现在借助 Lean 编译器，它能自动检查。团队成员无法上传任何编译不通过的内容，会被拒绝。因此，你可以与一些从未见过的人合作。 5.最后是讲大语言模型，首先陶哲轩就打脸了 GPT-4 的论文（我猜是微软那篇《GPT-4，通用人工智能的火花》），论文中号称 GPT-4 能解决国际数学奥林匹克问题，但实际上，这个问题不是 2022 年国际奥数竞赛的原始问题，而是一个简化版本，并且他们测试了几百道国际奥数竞赛问题，成功率只有1%，论文里的这个是精心挑选的恰巧能做对的。 6.陶哲轩提到了基于大语言模型的一些改进的方案：比如 CoT（Chain of Thought），也就是 LLM 做简单的算术运算都做不对，但是如果让它一步步解释，可能就对了。还可以教 AI 一些解题技巧，比如尝试简单的例子，反证法，尝试逐步证明等。比如让模型和编程语言或者工具连接，将大语言的输出结果交给 Wolfram 这样的专业数学工具或者 Python 这样的编程语言验证，并且迭代的进行修正和验证，直到得到正确的结果，这可以提升大语言模型生成的效果。即使借助这些手段，大语言模型还远远不能解决大多数数学问题，更不用说数学研究问题了！ 7.当然陶哲轩也没太过打击大家对于 AI 的信心，表示我们在 AI 上还是在不断的取得进展，还提到了他日常是怎么用 AI 的，比如说把 AI 当成灵感之源。 > 我曾遇到过一个问题，我尝试了几种方法，但都无法解决。于是，我尝试询问 GPT，你建议我使用什么其他方法来解决这个问题？GPT 给我提供了 10 种可能的方法，其中有 5 种我已经尝试过，或者明显没有帮助。的确，有几种方法并不实用。但其中有一种我还没尝试过的方法，那就是针对这个问题使用生成函数。当 GPT 建议我使用这种方法时，我意识到这就是我漏掉的正确方法。所以，将 GPT 视为一个交流伙伴，它确实具有一定的用处。还有使用 GitHub Copilot 帮他写代码，让它自动生成下一步的证明结果，Copilot 的智能提示有 20% 的概率能生成正确的下一步结果。 > 例如我使用的一个叫 GitHub Copilot 的工具，你只需要写下一半的证明，它就会尝试猜测接下来的内容。大概有 20% 的情况下，它能猜到接近正确的答案。然后你就可以说，我接受这个答案。好的，那么在这种情况下，我正在试图证明这个陈述。灰色的部分是 Copilot 给出的建议。结果发现第一行完全没用。不过第二行，尽管你可能看不清楚，却真的解决了这个问题。所以，你不能盲目接受它的输入，因为这些代码未必能顺利编译。但如果你对代码的运作方式已经有所了解，这将大大节省你的时间。这些工具正在变得越来越好。现在如果一个证明只需要一两行，它们就能自动完成。现在已经有了这样的实验，即通过迭代地让 AI 提供证明，然后让编译器进行反馈，如果编译出错，就把错误信息反馈给 AI。通过这种方法，我们开始能够验证四五步长的证明。当然，一个大型的证明可能需要数万行。所以，我们还没有达到能够立即得到一个正式证明的程度。但是，这已经是一个相当有用的工具。 8.对于大家关心的问题： AI 在数学领域现在到了哪一个阶段？是否未来几年利用 AI 能直接解决数学问题？陶哲轩也给出了他的看法： > 我认为我们还远远没有达到这个阶段。如果我们专注于非常特定的问题，你可以定制专门的 AI 来处理一小部分问题。即便如此，它们也不是完全可靠的，但还是有用的。不过至少在接下来的几年里，它们基本上将是非常有用的辅助工具，超越了我们已经熟悉的暴力计算辅助。他还提到了一些可能的 AI 能在数学领域提供帮助的方向： - AI 能够非常好地生成有价值的猜想 > 比如，我们已经看到了关于结理论的例子，它们已经可以推测出两个不同的统计量之间的关系。因此，我们希望能够创建大量的数据集，输入到 AI 中，它们就会自动找出各种不同的数学对象之间的有趣联系。虽然我们还不知道如何做到这一点，部分原因是我们没有这些庞大的数据集。但我认为这是未来可能实现的一个方向。 - 批量或者说规模化的证明大量数学定理 > 现在，因为证明定理是如此繁琐和艰难的过程，我们一次只能证明一个定理，如果你效率很高，可能一次能证明两三个。但是有了 AI，你可以设想一下未来的情况，我们不是试图解决一个问题，而是处理一类类似的1000个问题，然后告诉AI，尝试用这个方法解决这 1000 个问题，然后报告结果，哦，我能用这种技术解决 35% 的问题。那么另一种技术呢？我能解决这个百分比的问题。或者如果结合这些方法，又能解决多少问题？你可以开始探索问题的空间，而不是一个接一个地解决问题。这是你现在根本无法做到的事情，或者是你需要几十年时间，通过数十篇论文慢慢搞清楚各种技术能做什么，不能做什么。但是有了这些工具，你真的可以开始做规模前所未有的数学研究。所以，未来将会非常令人兴奋。 9.演讲环节结束前的最后一句话说的特别好： > 我们仍然会以传统方式证明定理。事实上，我们必须这样做，因为如果我们自己都不知道如何做这些事情，就无法引导这些 AI。但是我们将能够做很多现在无法做到的事情。这恰恰也是我们现在使用 AI 辅助编程的问题：如果我们自己都不知道如何构建软件，就很难引导好 AI 帮助我们生成高质量的代码。尽管 AI 在数学和编程领域变得越来越有用，但人类的洞察力和创造力仍然是创作价值的关键。总结的内容源自宝玉大佬的总结。 📢频道✈️ 群聊 (耕读) 📬投稿

Hashtags

#陶哲轩 #数学 #ai #辅助 #cot

椒盐豆豉剪报

@mtfront · Post #4075 · 18.10.2025, 07:24

Похожие Смотреть

听 Acquired 讲 Google AI 史这期听到一个 fun fact: Google 进军自动驾驶早期（2013）曾经考虑过要不要收购 Tesla，当年谈的价格是 30 亿美金（Tesla 现在市值是 1380 亿）。如果当年这个收购完成，也不会有现在的 Tesla 和 openAI （Elon Musk 当年投资 openAI 一部分原因是想让他们来研究自动驾驶，后来也因此谈崩）。好有意思的 what if 平行宇宙可能性。 #podcast#AI#tech#Google#Tesla#funfact

Hashtags

#podcast #ai #tech #google #tesla #funfact

BesnowCloud貝雪雲-公告頻道

@besnow_cloud · Post #3074 · 15.05.2025, 06:39

Похожие Смотреть

🔊【#深度解读】能源王国×GPU巨头联手打造“AI超级工厂”！500MW算力如何让沙特从石油输出大国跃升为AI强国？从感知到实体，AI演进四大阶段揭秘！想知道未来AI如何颠覆全球产业？点击👇阅读全文 #AI#芯片#NVIDIA#中东科技#未来已来 👉阅读全文

Hashtags

#深度解读 #ai #芯片 #nvidia #中东科技 #未来已来

Machinelearning

@ai_machinelearning_big_data · Post #9903 · 16.04.2026, 10:32

Похожие Смотреть

🌟Lyra 2.0: фреймворк для генерации исследуемых 3D-миров по одной фотографии. NVIDIA опубликовала веса модели и код Lyra 2.0 - системы, которая принимает на вход изображение, генерирует видео с управляемой траекторией камеры, а затем реконструирует его в 3D-гауссианы и полигональные меши. Готовые ассеты можно напрямую импортировать в игровые движки и робототехнические симуляторы. Система будет полезна для массовой генерации тренировочных 3D-сред для воплощенного ИИ. Главная задача, которую решает фреймворк - сохранение согласованности сцены при длительном пролете камеры. Lyra 2.0 хранит 3D-геометрию каждого кадра в отдельном кэше, при возврате извлекает релевантные исторические кадры по степени перекрытия видимости и устанавливает плотные геометрические соответствия через варпинг канонических координат. Геометрия используется только для маршрутизации информации - какие кадры извлечь и как их сопоставить с текущим ракурсом. За синтез внешнего вида отвечает диффузионная модель. Базовая модель построена на архитектуре Wan 2.1-14B с выходным разрешением 832×480. Для 3D-реконструкции применяется дообученная версия Depth Anything v3 в feed-forward режиме, а поверхностные меши извлекаются через иерархический подход на основе OpenVDB. На бенчмарках DL3DV и Tanks and Temples Lyra 2.0 превзошла все аналоги (GEN3C, CaM, SPMem, VMem, Yume-1.5 и HY-WorldPlay) практически по всем метрикам: FID, SSIM, LPIPS, субъективное качество и стилистическая согласованность. Первая версия фреймворка, вышедшая в сентябре, поддерживала лишь генерацию на коротких дистанциях. Ближайший конкурент второй версии, Genie 3 от Google, обладает схожими возможностями, но остаётся закрытым. 🟡Страница проекта 🟡Arxiv 🟡Модель 🖥GitHub @ai_machinelearning_big_data #AI#ML#3DWorlds#Lyra2#NVIDIA

Hashtags

#ai #ml #3dworlds #lyra2 #nvidia

Go! Announcements

@gorwachain_announcements · Post #1105 · 25.11.2025, 17:27

Похожие Смотреть

🚀 Go! Nation, Interested in tokenized futures? We’re talking about a massive unlock: equities are ~$128T globally, and the broader futures/derivatives layer is $1 quadrillion+ in notional scale. That’s the playing field. Futures are like making a deal today on what something will cost later (like locking in the price of apples next week). Equities are just tiny pieces of companies. FuturesFi is Go!’s next step: putting U.S. index futures strategies on-chain so people can access them in smaller, modular, transparent, fully trackable digital contracts. Think: clearer exposure, better rails, and a path to modern financial infrastructure, without the old gatekeeping. FuturesFi is being designed to target low-single-digit monthly performance in modeled scenarios via U.S. index futures strategies. No guarantees, not live performance, and not an offer to sell securities, just early interest for product updates. Important compliance note: Go!/FuturesFi is not a broker-dealer. This is not an offer to sell securities and nothing here is investment advice, we’re simply collecting interest for early access + product updates. 👉 Join the interest list here: https://forms.gle/wFY1534X8xqSUUtf7 #FuturesFi#Agentic#AI#Tokenization#OnChainFinance#DigitalAssets#Assets#LetsGo

Hashtags

#futuresfi #agentic #ai #tokenization #onchainfinance #digitalassets #assets #letsgo

NH | Новости технологий, AI и будущее

@neiro_office · Post #112 · 19.11.2025, 13:49

Похожие Смотреть

🚀 Google похоронил всех ИИ-помощников. Знакомьтесь: Antigravity Вчера, вместе с Gemini 3, Google выкатили Antigravity. И это уже не «ассистент» — это полноценная DEV-команда у вас в компьютере. ⚙️ Что это меняет: ⏺️Полный цикл: От идеи до работающего продукта. ИИ сам создаёт структуру, деплоит и поддерживает проект. ⏺️Не просто пишет код: Агенты работают с кодом, терминалом и браузером как живые разработчики. ⏺️Качество: Код доводится до состояния «продакшн-реди». ⏺️Масштаб: Создаёт игры, сайты, приложения. Можно запускать до 10 задач параллельно. ⏺️Всё включено: Автоапдейты, тесты, багфиксы, отчёты. 💎 Техническая основа: Работает на связке топ-моделей — Gemini 3 Pro, Claude Sonnet 4.5, GPT-OSS. ✅ И главное: Даже на бесплатном тарифе лимиты более чем щедрые. Antigravity уже доступен на MacOS, Windows и Linux. #Google#Antigravity#AI#Разработка#Gemini#DevOps Нейроофис💀

Hashtags

#google #antigravity #ai #разработка #gemini #devops

Machinelearning

@ai_machinelearning_big_data · Post #9301 · 23.12.2025, 13:56

Похожие Смотреть

🚀 Вышел QwenLong-L1.5 - модель для long-context reasoning, которая на длинных контекстах конкурирует с GPT-5 и Gemini-2.5-Pro. Коротко о модели - 30B параметров, из них 3B активных - Заточена под рассуждение на очень длинных контекстах - Полностью открыты веса, код обучения и рецепты данных Ключевые показатели: - +31.7 балла на OpenAI MRCR при контексте 128K - SOTA среди всех моделей - На уровне Gemini-2.5-Pro на 6 крупных long-QA бенчмарках - +9.69 на CorpusQA - +6.16 на LongBench-V2 Что интересного. 1. Синтетические данные в масштабе 14.1K длинных reasoning-сэмплов из 9.2B токенов без ручной разметки. Средняя длина - 34K токенов, максимум - 119K. 2. Стабильное RL-обучение Используется балансировка задач и Adaptive Entropy-Controlled Policy Optimization (AEPO), что позволяет стабильно обучать модели на длинных последовательностях. 3. Архитектура с памятью Итеративные обновления памяти за пределами окна 256K токенов. Результат - +9.48 балла на задачах с контекстом от 1M до 4M токенов. QwenLong-L1.5 - это один из самых сильных open-source шагов в сторону реально масштабируемого ризонинга с длинным контекстом Модель интересна не только результатами, но и тем, что весь стек обучения открыт. GitHub: https://github.com/Tongyi-Zhiwen/Qwen-Doc Paper: https://modelscope.cn/papers/2512.12967 Model: https://modelscope.cn/models/iic/QwenLong-L1.5-30B-A3B HF: https://huggingface.co/Tongyi-Zhiwen/QwenLong-L1.5-30B-A3B @ai_machinelearning_big_data #AI, #LLM, #opensource, #long#Owen

Hashtags

#ai #llm #opensource #long #owen

1 2•••50•••100•••150•••200•••250•••300•••350•••400•••450•••500•••550•••600•••650•••700•••750•••794 795796797 798•••800•••850•••900•••950•••971 972

← НазадСтр. 796 из 972Вперёд →