Post #1799

@qin2dim

QIN2DIM's Tech Channel

Views125Post view count

PostedNov 711/07/2025, 02:45 AM

Post content

LLM 赛道的节奏跟互联网有巨大差异，但具体差异在哪呢？我的理解上，首先是分工明确的合作模式和高效紧凑的协作流水线。实习生做榜单做数据做开源，运维测试做 AI Infra，怎样部署资源利用率高吞吐量大，怎么把模型放到并行推理框架上等等，AI dev 和 research 界限模糊一起做架构研究，方法论研究，参数配比研究，微调训练研究，乃至人机交互和数据接口。这不存在所谓的“鄙视链”，缺少任何一个组件整个模式都玩不转。另外，大模型可能是一个需要 provider 持续投入，必须紧凑迭代的奢侈品。无论走开源还是闭源。这里面最关键的一点就是“知识的截止更新时间”，也即，模型的“认知”与“普遍性价值观”是否跟随社会发展一起迭代进化。做一个思想实验，假设 2026 年出现了一个革命性大模型，把 HLE, SWE, livecode 全都刷到了 99%以上达到理论极致，能解决所有软件工程难题。并且把地球上所有模型厂商全都卷死，提供开源权重可供本地部署。然后5年过去了.... 编程领域，Python 的生产版本从 3.12 升级到 4.0 或 3.18（假设），一大堆开源库的接口参数出现变化，甚至出现一些在 2026 年以前还未立项的开源库。金融领域，新的股票上市，旧的股票 ST 甚至退市，各种行业新闻丑闻，集中度的变化，龙头的变化甚至新行业新产业的出现。这些集中度认知可能每1~3年都会有重大变化。诸如此类的例子还可以一直列下去，在 agent systems 中， web.run 的作用是弥补信息差，但能 carry challenge 的关键因素是模型的认知不会距离当前的社会节奏太遥远，否则，一些用来 search 的 keyword 甚至不会从模型的脑子里冒出来。有一种说法是 “llm 已经把互联网上的高质量数据啃食殆尽了”，但凡思考一下都觉得这种说法不靠谱。因此，在模型本身的投入上，我甚至觉得目前的场面是一种良性竞争，倒逼寡头自我迭代的最佳对象是另一个寡头，几乎不会是产品的用户。其余的构建在 LLM 之上的应用层，大多都还和互联网的模式周期有相似关联点。