Recent posts
Page 33 of 84 · 1,002 posts
Posted Nov 7
LLM 赛道的节奏跟互联网有巨大差异,但具体差异在哪呢? 我的理解上,首先是分工明确的合作模式和高效紧凑的协作流水线。实习生做榜单做数据做开源,运维测试做 AI Infra,怎样部署资源利用率高吞吐量大,怎么把模型放到并行推理框架上等等,AI dev 和 research 界限模糊一起做架构研究,方法论研究,参数配比研究,微调训练研究,乃至人机交互和数据接口。这不存在所谓的“鄙视链”,缺少任何一个组件整个模式都玩不转。 另外,大模型可能是一个需要 provider 持续投入,必须紧凑迭代的奢侈品。无论走开源还是闭源。这里面最关键的一点就是“知识的截止更新时间”,也即,模型的“认知”与“普遍性价值观”是否跟随社会发展一起迭代进化。 做一个思想实验,假设 2026 年出现了一个革命性大模型,把 HLE, SWE, livecode 全都刷到了 99%以上达到理论极致,能解决所有软件工程难题。并且把地球上所有模型厂商全都卷死,提供开源权重可供本地部署。 然后5年过去了.... 编程领域,Python 的生产版本从 3.12 升级到 4.0 或 3.18(假设),一大堆开源库的接口参数出现变化,甚至出现一些在 2026 年以前还未立项的开源库。 金融领域,新的股票上市,旧的股票 ST 甚至退市,各种行业新闻丑闻,集中度的变化,龙头的变化甚至新行业新产业的出现。这些集中度认知可能每1~3年都会有重大变化。 诸如此类的例子还可以一直列下去,在 agent systems 中, web.run 的作用是弥补信息差,但能 carry challenge 的关键因素是模型的认知不会距离当前的社会节奏太遥远,否则,一些用来 search 的 keyword 甚至不会从模型的脑子里冒出来。有一种说法是 “llm 已经把互联网上的高质量数据啃食殆尽了”,但凡思考一下都觉得这种说法不靠谱。 因此,在模型本身的投入上,我甚至觉得目前的场面是一种良性竞争,倒逼寡头自我迭代的最佳对象是另一个寡头,几乎不会是产品的用户。 其余的构建在 LLM 之上的应用层,大多都还和互联网的模式周期有相似关联点。
Posted Nov 6
Kimi K2 Thinking X | Moonshot API | Tech blog | HF weights
Posted Nov 6
“Vibe coding”获选柯林斯词典2025年度词汇 英国柯林斯词典将“vibe coding”(“氛围编程”)评为2025年度词汇。该词指一种利用人工智能将自然语言转化为计算机代码的新兴软件开发方式,由OpenAI创始工程师、前Tesla人工智能总监Andrej Karpathy提出。词典编纂团队表示,该词自2月首次出现以来使用频率大幅上升,体现出人工智能对语言与编程方式的深刻影响。 柯林斯团队基于收录240亿词汇的语料库评估词汇趋势。除“vibe coding”外,今年榜单还包括“biohacking”“aura farming”“broligarchy”“Henry”等反映科技与社会文化变化的新词。 The Guardian 🍀在花频道🍵茶馆📮投稿新鲜事
Posted Nov 6
https://x.com/hylarucoder/status/1986377496489828779
Posted Nov 6
https://x.com/Hx1u0/status/1986351238682976306
Posted Nov 6
RockAlpha 大更新 添加了很多东大的模型进来 https://rockalpha.rockflow.ai/ai-stock
Posted Nov 5
这 gemini,经常在开源库上给我改回车和标点符号。现在倒好,直接教作者怎么命名变量属于是。 https://github.com/vllm-project/vllm/pull/28128/commits/cd9dd32b2367fa61e3df51e3f265ebd0654fb235
Posted Nov 5
冲
Posted Nov 5
通用 Agent 现状 https://x.com/JaceSpidoodle/status/1985659036180873256
Posted Nov 5
通用 Agent 现状 https://x.com/JaceSpidoodle/status/1985659036180873256
Posted Nov 5
Google is preparing Nano Banana 2 for the upcoming release (市场传闻) https://www.testingcatalog.com/google-is-preparing-nano-banana-2-for-the-upcoming-release/
Posted Nov 4
Vals AI 致力于通过为实验室和工程团队提供公正的基准和可扩展的评估基础设施,推动人工智能未来发展的独立平台。 https://www.vals.ai/home