Skip to content
产品

使用 MCP 进行浏览器自动化:为 AI 提供 60 多种工具

JieGou 浏览器扩充功能如何使用 Model Context Protocol,让 AI 直接存取您的浏览器——在 Gmail、Slack、Jira 等平台上点击、读取、填写表单等操作。

JT
JieGou Team
· · 4 分钟阅读

大多数 AI 自动化平台透过 API 连接您的工具。这对结构化资料效果很好——读取 Jira 工作项、提取 Salesforce 联络人——但它遗漏了所有在浏览器中发生的事情。您在 Gmail 中撰写的电子邮件、正在阅读的 Slack 对话串、在 ServiceNow 中填写的表单。

JieGou 浏览器扩充功能弥补了这个差距。使用 Model Context Protocol (MCP),它为 AI 提供了 60 多种浏览器自动化工具的直接存取权限——从点击按钮到读取页面内容,再到撷取网路流量。

什么是 MCP?

Model Context Protocol 是一个开放标准,用于连接 AI 模型与外部工具和资料来源。MCP 提供了一个通用介面,任何 AI 模型都可以使用它来发现和调用工具,而不是为每个服务建立一次性的 API 整合。

JieGou 浏览器扩充功能实作了一个 MCP 客户端,透过 WebSocket 连接到 JieGou 伺服器。当 recipe 或 workflow 需要与基于浏览器的工具互动时,它会透过这个连接发送 MCP 工具调用,扩充功能会在使用者的浏览器中执行它。

扩充功能可以做什么?

这 60 多种工具分为几个类别:

页面互动 — 点击元素、填写表单栏位、选择下拉选单、勾选核取方块、卷动以及在页面间导览。AI 可以像您一样操作浏览器。

内容读取 — 读取页面上的可见文字、透过 CSS 选择器提取特定元素、取得页面标题和 URL,以及撷取完整的 DOM 结构。这为 AI 提供了您正在查看内容的上下文。

萤幕截图 — 撷取可见视窗或特定元素。适用于 UI 状态的视觉验证,或用于输入到多模态 AI 模型。

网路撷取 — 监控和撷取网路请求与回应。这帮助 AI 了解浏览器与后端服务之间流动的资料。

平台专用工具 — 针对 Gmail(撰写、读取、搜寻邮件)、Slack(读取讯息、发布到频道)、Jira(建立问题、更新工作项)、Salesforce(读取记录、更新栏位)、ServiceNow(管理事件)和 HubSpot(存取联络人和行销活动)的专门处理器。

专用自动化视窗

在执行复杂的自动化时,您不希望 AI 在您的活动浏览器分页中到处点击。JieGou 会开启一个专用的自动化视窗——一个独立的浏览器环境,MCP 工具在其中执行而不会干扰您的工作。

这个视窗在背景执行,因此即使您在浏览器中进行其他任务,自动化也会继续。结果会即时串流回控制台。

如何连接到 recipes 和 workflows

浏览器工具会与所有其他工具一起显示在 recipe 编辑器和 workflow 建构器中。当您建立需要从网页读取资料或填写表单的 recipe 时,您可以从工具清单中选择相关的浏览器工具。

在执行期间,JieGou 会将工具调用路由到浏览器扩充功能,等待结果,并将其回传到 recipe 或 workflow 步骤中。AI 对待浏览器工具的方式与 API 工具完全相同——没有特殊的语法或配置。

平台专用智慧

扩充功能不只是泛用地与网页互动。对于支援的平台,它具有专门的注入脚本,可以理解平台的 DOM 结构并提取有意义的资料。

例如,Gmail 处理器可以识别电子邮件对话串、提取寄件者和收件者资讯、读取邮件内容并撰写新邮件——全部透过理解 Gmail 特定的 HTML 结构来完成。Jira 处理器知道如何从 Jira 介面读取问题栏位、评论和冲刺资料。

这种平台专用智慧意味着 AI 可以在比原始 DOM 操作更高的抽象层级上使用您的工具。

安全性与权限

浏览器扩充功能需要明确的使用者授权,并在多层安全机制下运作。

身份验证与授权。 扩充功能使用基于 JWT 的身份验证连接到 JieGou 的 MCP 伺服器。每个 WebSocket 连接都会根据使用者的工作阶段进行验证,扩充功能在没有有效的活动 token 的情况下无法执行工具。Token 具有短期有效性,并限定于使用者帐户的权限范围。

API 金钥验证。 在分派任何工具调用之前,系统会验证使用者的 API 金钥是否处于活动状态且已正确配置。无效或已撤销的金钥会在到达浏览器之前被拒绝,防止未经授权的自动化尝试。

速率限制。 每个使用者和每个工具的速率限制可防止滥用和意外的失控自动化。如果 workflow 触发了异常大量的浏览器操作,速率限制会节流执行,而不是压垮目标应用程式。

稽核日志。 每个工具调用都会记录使用者、工具名称、时间戳记、目标 URL 和结果状态。这些稽核项目可查询和汇出,让管理员完全了解执行了哪些浏览器自动化以及由谁执行。

工具 ACL。 管理员可以配置允许和拒绝清单,控制哪些浏览器工具可供哪些角色使用。支援团队可能可以存取工作项管理工具,但无法存取修改 CRM 记录的工具。ACL 在工具调用到达扩充功能之前于伺服器层级执行。

BYOK 相容性。 Bring Your Own Keys 适用于浏览器自动化,就像它适用于 LLM 调用一样——扩充功能在您的浏览器中运作,资料在您的浏览器和您正在使用的网路应用程式之间流动。JieGou 协调自动化,但看不到页面内容。

开始使用

浏览器扩充功能适用于 Chrome 和 Firefox。从扩充功能商店安装,使用您的 JieGou 帐户登入,浏览器工具会立即在您的 recipes 和 workflows 中可用。深入了解浏览器自动化查看所有整合

browser-extension mcp automation integrations
分享这篇文章

喜欢这篇文章吗?

在您的信箱中获取工作流程技巧、产品更新和自动化指南。

No spam. Unsubscribe anytime.