TGTGInsighttelegram intelligenceLIVE / telegram public index
← V2EX
V2EX avatar

TGINSIGHT POST

Post #201231

@pushv2ex

V2EX

Views3帖子阅读量
发布4月14日2026/04/14 08:54
Post content

帖子内容

[分享创造] [开源] 视觉状态机 + Electron,让 AI 自己操作微信/企微/WhatsApp 写了个东西,开源了:sightflow.dev (代码会在本周同步在 GitHub ,同步在网站上) 一句话:给大模型装眼睛和手。它能自己打开微信、企业微信、WhatsApp ,像人一样看界面、读消息、打字回复。 不是 API 套壳——因为这几个平台根本没给开发者开放可用的 API 。 核心方案: ● 视觉自动化状态机(看窗口、切任务) ● Electron 跨桌面 ● 键盘模拟 + 状态流转 最难的部分(视觉执行层)我已经啃完了,代码已开源。上层留了一个本地 Skill Server ,你只需要写业务逻辑(比如自动客诉、销售跟进、群回复),不用碰底层。 适用场景: ● 无 API 的私域自动化(客服、销售、运营) ● 跨 WhatsApp / 微信 / 企微的统一消息处理 ● 任何需要“AI 模拟人操作桌面软件”的场景 为什么搞这个? 因为全球 5000 万+ 企业用 WhatsApp Business ,中国 1200 万+ 企业微信用户,但官方接口要么没有,要么贵得离谱。AI Agent 想落地到最赚钱的业务场景,绕不开这些平台。 现状: ● 视觉执行层稳定,可直接 clone 跑 demo 有场景的开发者欢迎 clone 下来跑一跑,也欢迎讨论。