TGTGInsighttelegram intelligenceLIVE / telegram public index
← QIN2DIM's Tech Channel
QIN2DIM's Tech Channel avatar

TGINSIGHT POST

Post #2168

@qin2dim

QIN2DIM's Tech Channel

Views93Post view count
PostedJan 2101/21/2026, 12:39 AM
Post content

Post content

DeepSeek 新模型 MODEL1 曝光,或采用全新架构 DeepSeek 在 GitHub 更新 FlashMLA 代码时披露了代号为 MODEL1 的新模型。该代号在 114 个文件的 28 处位置出现,且与 V32(DeepSeek-V3.2)并行存在,预示其可能采用全新架构。技术细节显示,MODEL1 在 KV 缓存布局、稀疏性处理及 FP8 解码的内存优化方面与现有模型存在多处差异。 此前有消息称,DeepSeek 拟于 2 月中旬春节前后发布下一代旗舰模型。 华尔街见闻 🍀在花频道🍵茶馆聊天📮投稿