Најди сличен содржај

Изворен канал @cryptoattack · Post #20708 · 23 дек.

😨Главное за сегодня: 🇺🇸США (крипто-#ETF): - Трамп назначил Бо Хайнса главой "Криптосовета", а CEO a16z назначен старшим советником по вопросам #AI - Налоговая США (IRS) утверждает, что стейкинг криптовалют облагается налогом - Phoenix Group планирует листинг на Nasdaq в 2025 году 🇰🇵#HYPE В HyperLiquid наблюдается рекордный отток на фоне опасений пользователей, что северокорейские хакеры могут искать уязвимости (несколько кошельков северокорейских хакеров имеют потери >700 000$ от торговли на бирже). #HYPE Hyperliquid Labs опровергают, что их взломали 🇰🇷 Новый комитет Южной Кореи разрабатывает санкции против манипуляторов крипторынка 🇸🇻#BTC Правительство Сальвадора продолжает накопление#BTC 🇯🇵 Gate Group приобрели Coin Master и официально вышли на японский рынок 🔥 MicroStrategy приобрели ещё 5,262 #BTC 🥳#BNB Binance Alpha выпустили новую партию проектов 🥳#TONПавел Дуров: Общая выручка Telegram в 2024 году превысила 1 млрд $, и мы завершаем год с более чем 500 млн $ денежных резервов, не считая криптоактивов 🙋‍♂ Nokia подали патент на «устройство, метод и компьютерную программу», которые могут шифровать цифровые активы 🥳#CRO Crypto .com запускает регулируемую службу хранения цифровых активов для клиентов из США и Канады 🙋‍♂ Moonpay ведет переговоры о приобретении Helio за ~150 млн $ 🚫 Регулятор Малайзии запретили Atomic Wallet работать в стране 🔮#CGX#RON Community Gaming запустит свой рынок прогнозов Forkast, ориентированный на игры, в сети #RONIN ✅ Paraswap DAO одобрила внедрение нового токена для замены #PSP 🙋‍♂#LDO#ETH Lido запустили Ethereum SDK 🆕Листинги: - Binance добавляет фьючерсы на #HIVE - Binance Launchpool добавляет#BIO 🕵️‍♂️Активность китов и SmartMoney: - С адреса команды Pendle перевели 625 000 #PENDLE на Binance - транзакции китов 📊Графики и отчёты: - #FUD Новые трейдеры, которые присоединились к рынку за последние 2-3 месяца, активно распродают#BTC и #ETH - WhaleMap: Уровень 98 133$ остаётся важным, учитывая китовые накопления #BTC - за последние 2 года наблюдался значительный рост числа держателей криптовалют 📈 - #UNI Общий объем #USDC на Uniswap превысил 1 трлн $ 📈 - DropsTab: новые токены в стадии накопления, поддерживаемые топовыми венчурными инвесторами - ТОП#AI-агентов по росту цен за последние 7 дней - отчёт CoinShares по фин потокам - отчет BNB Chain за 2024 год #BNB 💰Сборы средств: - Avalon Labs - 10 млн $ - #USUALUsual - 10 млн $ от Binance и Kraken ✏️События на завтра: 🔓 Разлоки: Ribbon Finance (#RBN) - 1,06% ($4,18m) 🎁#AGI Delysium запустят программу вознаграждений 🇺🇸 Durable Goods Orders (MoM) (Nov) - 16:30 мск - Redbook (YoY) - 16:55 мск - New Home Sales (Nov) - 18:00 мск

Hashtags

#etf #ai #hype #btc #bnb #ton #cro #cgx #ron #ronin #psp #ldo #eth #hive #bio #pendle #fud #uni #usdc #usual #rbn #agi

Резултати

Пронајдени 1 слични објави

Пребарај: #thinkingwithvisualprimitives

当前筛选 #thinkingwithvisualprimitives清除筛选

AI一线｜ShareCentre

@ShareCentre · Post #7252 · 30.04.2026 г., 13:58

Најди слично Погледај

DeepSeek 发布 Thinking with Visual Primitives：让多模态模型“边指边想” DeepSeek 多模态团队发布技术报告 Thinking with Visual Primitives，提出一种面向视觉推理的新范式：不再只让模型用语言写出思维链，而是在推理过程中同步使用点（points）和框（bounding boxes）作为“视觉认知锚点”，让模型像人类数数、找路、看图推理时用手指辅助一样，把抽象语言推理落到具体图像坐标上。这项工作将问题定义为 Reference Gap：传统 Chain-of-Thought 主要停留在语言空间，面对密集空间布局时，很难精确指向“这个物体”“那条路径”或“下一步位置”，容易导致推理链中的指代混乱、逻辑坍塌和幻觉。 📌 核心思路：让模型“Point while it reasons” DeepSeek 的方法是把 points 和 bounding boxes 直接插入推理轨迹，作为视觉推理的最小单元。 - points：用于定位某个具体位置，例如数物体、标记路径节点、指向关键区域 - bounding boxes：用于框定视觉对象或空间范围，帮助模型维持稳定指代 - visual primitives：成为模型推理过程的一部分，而不只是最终输出的标注结果换句话说，模型不是先“看图”，再用纯文本解释；而是在思考过程中不断把语言概念绑定到图像坐标上。 ⚙️ 解决什么问题？报告重点面向三类任务： - Counting：顺序扫描与验证，减少漏数、重复数 - Spatial Reasoning：多跳空间逻辑推理，例如判断多个对象之间的位置关系 - Topological Reasoning：迷宫导航、路径追踪等结构化视觉推理任务 DeepSeek 表示，该方法尤其针对复杂结构推理中的 Reference Gap，而不是单纯追求“看得更清楚”。此前多模态模型常用高分辨率裁剪、图像重看等方式缓解 Perception Gap，但在需要精确指代和持续追踪的位置推理中，语言本身仍然不够精确。 📎 性能与模型基础项目 README 显示，该方法构建在 DeepSeek-V4-Flash 架构基础上，并采用视觉 token 压缩：每 4 个 visual tokens 的 KV cache 压缩为 1 个 entry，以降低图像 token 消耗。 DeepSeek 称，在与研究重点相关的计数和空间推理基准上，该模型在更低图像 token 预算和较紧凑模型规模下，表现可对齐 GPT-5.4、Claude Sonnet 4.6、Gemini 3 Flash 等前沿模型。官方同时强调，这些成绩只覆盖论文相关评测维度，并不代表模型整体能力对比。 🔙 背景：DeepSeek 从长上下文走向视觉推理这一发布紧接 DeepSeek-V4 预览版之后。此前 V4 系列强调 1M 上下文、DSA 稀疏注意力、Agentic Coding 与长上下文效率，V4-Flash 则定位更快、更便宜的轻量版本。 Thinking with Visual Primitives 可以看作 DeepSeek 在 V4 架构上的一次多模态扩展：从“长文本 / Agent 推理效率”进一步走向“视觉结构推理效率”。 ⚔️ 竞品对比 - OpenAI / Anthropic / Google：当前前沿多模态模型普遍具备图像理解、视觉问答和一定的视觉思维链能力，但多数仍以语言链条表达推理过程 - Qwen / MiMo / GLM：国产多模态模型近期密集更新，Qwen3.5-Omni、MiMo-V2.5、GLM-5V-Turbo 分别强调全模态、Agent 能力和视觉编程 - DeepSeek：此次切入点更偏“视觉推理机制”本身，用 points 和 boxes 作为可解释、可追踪的中间推理单元这使 DeepSeek 的差异化不只是“多模态输入”，而是把视觉坐标变成推理语言的一部分。 🏢 DeepSeek 近况 DeepSeek 近期保持“技术报告 + 开源仓库 + 后续释放数据/权重”的节奏。官方表示，Thinking with Visual Primitives 的内部基准和部分 cold-start 数据将于未来公开，模型权重会集成进 foundation model 并在未来发布。这延续了 DeepSeek 过去以技术路线和工程效率建立影响力的打法：先公开方法和报告，再逐步释放更完整的生态资源。 📎 资源链接 - 原推文：https://x.com/PKUCXK/status/2049798862504944117 - GitHub 仓库：https://github.com/deepseek-ai/Thinking-with-Visual-Primitives - 技术报告：https://github.com/deepseek-ai/Thinking-with-Visual-Primitives/blob/main/Thinking_with_Visual_Primitives.pdf - 相关背景：DeepSeek-V4 预览版发布并开源：https://t.me/ShareCentre/7236 #DeepSeek#多模态#视觉推理#VLM#AI大模型#ThinkingWithVisualPrimitives

Hashtags

#deepseek #多模态 #视觉推理 #vlm #ai大模型 #thinkingwithvisualprimitives