Skip to content
プロダクト

MCPによるブラウザ自動化:AIが使える60以上のツール

JieGouのブラウザ拡張機能がModel Context Protocolを使用して、AIにブラウザへの直接アクセスを提供する方法——Gmail、Slack、Jiraなどのプラットフォームでのクリック、読み取り、フォーム入力など。

JT
JieGou Team
· · 2 分で読めます

ほとんどのAI自動化プラットフォームはAPIを介してツールに接続します。構造化データには十分に機能します——Jiraチケットの読み取り、Salesforceの連絡先の取得——しかし、ブラウザで起こるすべてのことを見逃します。Gmailで作成中のメール。読んでいるSlackスレッド。ServiceNowで入力中のフォーム。

JieGouのブラウザ拡張機能がそのギャップを埋めます。Model Context Protocol(MCP)を使用して、ボタンのクリックからページコンテンツの読み取り、ネットワークトラフィックのキャプチャまで、60以上のブラウザ自動化ツールへのAIの直接アクセスを提供します。

MCPとは

Model Context Protocolは、AIモデルを外部ツールやデータソースに接続するためのオープンスタンダードです。すべてのサービスに対して個別のAPI統合を構築する代わりに、MCPは任意のAIモデルがツールを検出して呼び出すために使用できるユニバーサルインターフェースを提供します。

JieGouのブラウザ拡張機能は、WebSocketを介してJieGouサーバーに接続するMCPクライアントを実装しています。recipeやworkflowがブラウザベースのツールとインタラクションする必要がある場合、この接続を通じてMCPツール呼び出しを送信し、拡張機能がユーザーのブラウザでそれを実行します。

拡張機能で何ができるか

60以上のツールはいくつかのカテゴリに分かれます:

ページインタラクション — 要素のクリック、フォームフィールドの入力、ドロップダウンの選択、チェックボックスの操作、スクロール、ページ間のナビゲーション。AIはあなたと同じ方法でブラウザを操作できます。

コンテンツ読み取り — ページ上の表示テキストの読み取り、CSSセレクタによる特定要素の抽出、ページタイトルとURLの取得、完全なDOM構造のキャプチャ。これにより、AIはあなたが見ているものについてのコンテキストを得ます。

スクリーンショット — 表示されているビューポートまたは特定の要素をキャプチャ。UI状態のビジュアル検証や、マルチモーダルAIモデルへの入力に有用です。

ネットワークキャプチャ — ネットワークリクエストとレスポンスの監視とキャプチャ。ブラウザとバックエンドサービス間でどのようなデータが流れているかをAIが理解するのに役立ちます。

プラットフォーム固有ツール — Gmail(メールの作成、読み取り、検索)、Slack(メッセージの読み取り、チャネルへの投稿)、Jira(課題の作成、チケットの更新)、Salesforce(レコードの読み取り、フィールドの更新)、ServiceNow(インシデントの管理)、HubSpot(連絡先とキャンペーンへのアクセス)の専用ハンドラー。

専用自動化ウィンドウ

複雑な自動化を実行する際、AIにアクティブなブラウザタブでクリックさせたくはありません。JieGouは専用の自動化ウィンドウを開きます——作業を妨げることなくMCPツールが実行される隔離されたブラウザコンテキストです。

このウィンドウはバックグラウンドで実行されるため、他のタスクにブラウザを使用している間も自動化が継続されます。結果はリアルタイムでコンソールにストリーミングされます。

recipeとworkflowとの接続方法

ブラウザツールは、recipeエディターとworkflowビルダーの他のすべてのツールと並んで表示されます。Webページからデータを読み取ったりフォームに入力したりする必要があるrecipeを作成する場合、ツールリストから関連するブラウザツールを選択します。

実行中、JieGouはツール呼び出しをブラウザ拡張機能にルーティングし、結果を待ち、recipeまたはworkflowステップにフィードバックします。AIはブラウザツールをAPIツールとまったく同じように扱います——特別な構文や設定は不要です。

プラットフォーム固有のインテリジェンス

拡張機能は単にWebページと汎用的にインタラクションするだけではありません。サポートされているプラットフォームについては、プラットフォームのDOM構造を理解し、意味のあるデータを抽出できる専用のインジェクトスクリプトを持っています。

例えば、Gmailハンドラーはメールスレッドを識別し、送信者と受信者の情報を抽出し、メッセージ本文を読み取り、新しいメールを作成できます——すべてGmailの特定のHTML構造を理解することによって。Jiraハンドラーは、Jiraのインターフェースから課題フィールド、コメント、スプリントデータを読み取る方法を知っています。

このプラットフォーム固有のインテリジェンスにより、AIは生のDOM操作よりも高い抽象化レベルでツールを操作できます。

セキュリティと権限

ブラウザ拡張機能はユーザーの明示的な承認を必要とし、複数のセキュリティレイヤー内で動作します。

**認証と認可。**拡張機能はJWTベースの認証を使用してJieGouのMCPサーバーに接続します。各WebSocket接続はユーザーのセッションに対して検証され、有効でアクティブなトークンなしに拡張機能はツールを実行できません。トークンは短命でユーザーのアカウント権限にスコープされます。

**APIキー検証。**ツール呼び出しがディスパッチされる前に、システムはユーザーのAPIキーがアクティブで適切に設定されていることを検証します。無効または取り消されたキーはブラウザに到達する前に拒否され、不正な自動化の試みを防ぎます。

**レート制限。**ユーザーごとおよびツールごとのレート制限が悪用や偶発的な暴走自動化を防ぎます。workflowが異常に多数のブラウザアクションをトリガーした場合、レート制限がターゲットアプリケーションを圧倒する代わりに実行をスロットリングします。

**監査ログ。**すべてのツール呼び出しがユーザー、ツール名、タイムスタンプ、ターゲットURL、結果ステータスとともにログに記録されます。これらの監査エントリはクエリおよびエクスポート可能で、管理者にどのブラウザ自動化が誰によって実行されたかの完全な可視性を提供します。

**ツールACL。**管理者は、どのブラウザツールがどのロールに利用可能かを制御する許可リストと拒否リストを設定できます。サポートチームにはチケット管理ツールへのアクセスを許可し、CRMレコードを変更するツールへのアクセスは許可しないことができます。ACLはツール呼び出しが拡張機能に到達する前にサーバーレベルで適用されます。

**BYOK互換。**Bring Your Own Keysはブラウザ自動化にもLLM呼び出しと同様に適用されます——拡張機能はブラウザ内で動作し、データはブラウザと使用中のWebアプリケーション間を流れます。JieGouは自動化をオーケストレーションしますが、ページコンテンツは見ません。

はじめに

ブラウザ拡張機能はChromeとFirefox向けに利用可能です。拡張機能ストアからインストールし、JieGouアカウントでサインインすると、ブラウザツールがrecipeやworkflowですぐに利用可能になります。ブラウザ自動化の詳細を見るか、すべてのインテグレーションを見る

browser-extension mcp automation integrations
この記事をシェアする

この記事はお役に立ちましたか?

ワークフローのヒント、製品アップデート、自動化ガイドをメールでお届けします。

No spam. Unsubscribe anytime.