Post content
暴论: 中短期内任何运行在手机上的系统级 AI Agent 应用都会迅速死亡 目前观察到的所有产品思路全错,把大模型这么昂贵的智能资源框在一个应用启动器里,属实可惜。 类比于 GKD 等项目,用户想关软件开屏广告,有人愿意免费提供开源产品,双方一拍即合应用上线,但是问过广告商意见了吗就关,结局当然是金主压力产品经理,一个简单的自动化点击关闭操作,最后变成了涉及隐私安全和脱壳敲砖甚至带点神经网络的魔法对轰游戏。 同样,豆包想自然语言控制微信美团淘宝抖音做任务,人家理你吗你就点。 你想让豆包帮你下单午餐,比价,点最实惠的评价最高的不刷单的。然后呢?你让美团自己在 APP 里做的这个“支持语音输入”的“小团”咋办?这个 agent 几秒钟就能从推荐系统的茧房里翻出来拉个表提供下单入口。而豆包能做的就是帮你打开美团,剩下的步骤都是无用功,你在点 AI 给你弹出的各种确认框,你在跟 AI 丢球玩,你没在点外卖。 同样的,小红书,微博,淘宝,抖音,推特,微信QQ都会做自己的 Agent 应用,本地部署一个 kimi k2 thinking 就能跑通所有商业化路径。然后剩下的,就是跟豆包玩魔法对轰,想操控我的App问我意见了吗,我直接封用户账号,用一次封 10 分钟。让用户把这层不满传递到你的产品上。 4 种结局: 1️⃣豆包root用户化身贾维斯,所有从手机流出的字节码都被完全接管,被用户爆锤 2️⃣豆包VL所见所得像控制鼠标一样从硬件层触发交互信号,被应用厂爆锤。因为这条路线最直接的落地场景就是手机端爬虫,天顶星科技压制一切反爬措施的模拟用户。 3️⃣豆包夹缝中生存,成为偶尔被使用但长期吃灰的桌面图标,当然,它会多几个一起吃灰的领居。很快,我就会试着让豆包卸载手机上的其他 Agent 应用,然后,豆包会花费数分钟处理我几秒钟就能做完的操作。 4️⃣豆包离线版部署,可以远程更新但模型跑在本地的脚本小子,iOS 快捷指令的升级版。那 Siri 小爱 小艺 小布 yoyo 小溪 Gemini 小兴 Mora 怎么看?礼貌问价还是自研科技都很难说。 这种“自然语言交互”的场景有很多没有考虑到的问题 1️⃣手机码字效率极低,语音输入容易产生歧义,一旦double check就会效率雪崩 2️⃣多数手写输入法用户和 60s 语音消息用户,基本离老花字号不远了,这类人群会为 AI 付费吗,存疑。