TGTGInsighttelegram intelligenceLIVE / telegram public index
← Newlearnerの自留地
Newlearnerの自留地 avatar

TGINSIGHT POST

Post #14949

@NewLearnerChannel

Newlearnerの自留地

閲覧数3,760投稿閲覧数
投稿日11月11日2025/11/11 07:02
コンテンツ

投稿内容

#App 🌐 BrowserOS:开源 AI 浏览器 Github | 官网 ✨Features - 教学模式:用户通过单次操作演示工作流程以及语音解释,AI 代理即可学习并创建可重复执行的自动化任务,降低了自动化门槛 - 聊天侧边栏:在任意网页侧边栏直接调用 ChatGPT、Claude、Gemini 的网页 APP,无需切换标签页即可完成内容总结、草稿撰写等任务 - LLM Hub:在一个标签页里同时打开多个 LLM APP,例如 ChatGPT、Claude、Gemini 、Grok、Perpleixity。最多一次行打开三个,垂直分屏 - 用户指定模型,使用用户的 API key,支持通过 Ollama 和 LMStudio 在本地运行 AI 模型 - MCP 集成:内置 Gmail、Calendar、Google Docs、Notion 等应用的 Model Context - 常规功能例如 AI 网页操作,侧边栏 AI 对话,标签页作为上下文 ⚙️技术 BrowserOS 是一个完整的 Chromium 浏览器分支,而非浏览器扩展。利用标准扩展 API 无法触及的无障碍树,为 AI 代理提供必要的页面结构信息。 其核心代理功能直接在 Chromium 的 C++ 源码(占代码库 53.7%)中实现,而非通过 JavaScript 自动化框架,性能相比后者提升了 20-40 倍。AI 代理通过一个专为 AI 推理优化的“增强 DOM 树”与网页交互,该树提供了比标准 DOM 更丰富的页面元素语义信息。 项目采用 AGPL-3.0 许可证,确保其衍生项目保持开源。 👨🏻‍💻使用场景 - 信息处理与研究:自动化执行跨网站的复杂研究任务,例如查找特定信息、提取关键数据并将其整合到文档或表格中。 - 业务流程自动化:自动从缺少 API 的企业内部系统(如旧版 ERP 或仪表盘)中提取数据,并更新到 Google Sheets 等现代办公工具中。 - 数据录入与表单填写:自动完成重复性高的表单填写工作,如批量提交工作申请、填写报销单等。 - 工作与生产力:利用 MCP 集成,通过自然语言指令直接操作 Gmail、Google Calendar 等应用,实现邮件草拟、会议安排等任务。 - 电商与购物:自动化执行商品搜索、跨平台比价、应用折扣码以及完成支付流程。 👀感想 作为开源产品 Browser OS 的核心功能要落后 Comet 和 Atlas。同样的任务在 Browser OS 上无法完成。 教学模式让自动化变得很简单,但是无法举一反三,只能在同一个网站,同样的数据,呆板的做同一个自动化。 侧边栏 LLM Web App 和一个标签页多个 LLM Web App 分屏也是过去很火的功能,但如今转被淘汰了的。 设计上也是浓浓的 Chromium 的味道,几乎没有什么新动画。视觉体验上显著毛坯。 频道:@NewlearnerChannel