TGTGInsighttelegram intelligenceLIVE / telegram public index
← QIN2DIM's Tech Channel
QIN2DIM's Tech Channel avatar

TGINSIGHT POST

Post #1799

@qin2dim

QIN2DIM's Tech Channel

Views125Post view count
PostedNov 711/07/2025, 02:45 AM
Post content

Post content

LLM 赛道的节奏跟互联网有巨大差异,但具体差异在哪呢? 我的理解上,首先是分工明确的合作模式和高效紧凑的协作流水线。实习生做榜单做数据做开源,运维测试做 AI Infra,怎样部署资源利用率高吞吐量大,怎么把模型放到并行推理框架上等等,AI dev 和 research 界限模糊一起做架构研究,方法论研究,参数配比研究,微调训练研究,乃至人机交互和数据接口。这不存在所谓的“鄙视链”,缺少任何一个组件整个模式都玩不转。 另外,大模型可能是一个需要 provider 持续投入,必须紧凑迭代的奢侈品。无论走开源还是闭源。这里面最关键的一点就是“知识的截止更新时间”,也即,模型的“认知”与“普遍性价值观”是否跟随社会发展一起迭代进化。 做一个思想实验,假设 2026 年出现了一个革命性大模型,把 HLE, SWE, livecode 全都刷到了 99%以上达到理论极致,能解决所有软件工程难题。并且把地球上所有模型厂商全都卷死,提供开源权重可供本地部署。 然后5年过去了.... 编程领域,Python 的生产版本从 3.12 升级到 4.0 或 3.18(假设),一大堆开源库的接口参数出现变化,甚至出现一些在 2026 年以前还未立项的开源库。 金融领域,新的股票上市,旧的股票 ST 甚至退市,各种行业新闻丑闻,集中度的变化,龙头的变化甚至新行业新产业的出现。这些集中度认知可能每1~3年都会有重大变化。 诸如此类的例子还可以一直列下去,在 agent systems 中, web.run 的作用是弥补信息差,但能 carry challenge 的关键因素是模型的认知不会距离当前的社会节奏太遥远,否则,一些用来 search 的 keyword 甚至不会从模型的脑子里冒出来。有一种说法是 “llm 已经把互联网上的高质量数据啃食殆尽了”,但凡思考一下都觉得这种说法不靠谱。 因此,在模型本身的投入上,我甚至觉得目前的场面是一种良性竞争,倒逼寡头自我迭代的最佳对象是另一个寡头,几乎不会是产品的用户。 其余的构建在 LLM 之上的应用层,大多都还和互联网的模式周期有相似关联点。