JieGouのブラウザ拡張機能をローンチした当初、それはツールエグゼキューターでした。RecipeとworkflowがModel Context Protocolを通じて60以上のブラウザ自動化ツール——クリック、読み取り、フォーム入力——を呼び出せました。強力ですが、受動的でした。拡張機能はrecipeが指示した時にのみ動作しました。
現在、拡張機能はそれ自体がAIアシスタントです。サイドパネルを開き、見ているページについて質問すると、画面上の内容を理解した回答が得られます。コマンドパレットでワンキーストロークのアクション。エージェントに操縦を委ね、自律的にブラウジング。ブラウザインタラクションを記録して後で再生。
ページ認識付きAIチャット
拡張機能のアイコンをクリックするかキーボードショートカットを使用してサイドパネルを開きます。質問を入力すると、AIが表示中のページを完全に認識して応答します。
拡張機能はURLだけを見ているわけではありません。ページのテキストコンテンツ(最大8,000文字)を抽出し、使用中のプラットフォーム——Gmail、Slack、Jira、Salesforce、Confluence、ServiceNow、LinkedIn、HubSpot——を検出します。プラットフォーム検出により特殊なコンテキスト抽出がトリガーされ、AIは単なる汎用Webページではなく、Jiraチケットやスレッドを見ていることを理解します。
会話はパネルの開閉をまたいで保持されます。サイドパネルを閉じ、別のページをブラウズし、再度開いても——チャット履歴がそこにあります。最大50メッセージがブラウザのローカルストレージに保存されるため、AIにアクションを明示的に依頼しない限り、データはデバイスから出ません。
2つのモードが利用可能です:Q&A用の標準チャットと、マルチステップアクション用のエージェントモード(詳細は後述)。ワンクリックで切り替えられます。
コマンドパレット:Cmd+Shift+K
Cmd+Shift+K(Mac)またはCtrl+Shift+K(Windows/Linux)を押すと、10のビルトインアクションを含む検索可能なパレットが表示されます:
ページアクション:
- Screenshot Page — ビューポートをPNGとしてキャプチャし、クリップボードにコピー
- Copy as Markdown — ページコンテンツをクリーンなMarkdownとして抽出
- Extract All Links — ページからすべてのリンクを取得
- Extract Tables as CSV — HTMLテーブルをCSV形式に変換
- Save to Notepad — コンテンツをローカルストレージに保存
AIアクション:
- Summarize Page — 現在のページのAI生成サマリー
- Extract Structured Data — 非構造化コンテンツから構造化情報を抽出
- Draft Reply — コンテキストに応じた返信を生成(メールやスレッドに便利)
- Explain This — 技術的なコンテンツの平易な解説
ナビゲーション:
- Search Open Tabs — 開いているすべてのブラウザタブのあいまい検索
フィルタリングには入力、ナビゲーションには矢印キー、実行にはEnterを使用します。結果は自動的にクリップボードにコピーされます。
ビルトイン以外にも、カスタムアクションを作成できます。{selectedText}、{pageUrl}、{pageTitle}などの変数を含むプロンプトテンプレートを定義すると、アクションがデフォルトと並んでパレットに表示されます。チームにサポートチケットの要約や会議メモからのアクションアイテムの抽出に関する標準的な方法がある場合、カスタムアクションとして保存すれば常にワンキーストロークで利用できます。
エージェントブラウジング
標準チャットは質問に答えます。エージェントモードはアクションを取ります。
エージェントモードを有効にすると、AIはマルチターンループに入ります。ブラウザツール呼び出しを提案できます——このボタンをクリック、あのフォームに入力、別のページに移動——そして承認後に拡張機能がそれを実行します。
承認フローの仕組み:
- 指示を入力します:「メールで最新の請求書を見つけて、accounting@company.comに転送して」
- AIはアプローチを計画し、ツール呼び出しを提案します:Gmailに移動、「請求書」を検索、最新の結果を開く
- 各ツール呼び出しはアクション名とパラメータを含むカードで表示されます。読み取り専用ツール(ページコンテンツの読み取り、スクリーンショットの撮影)は自動実行されます。変更ツール(クリック、入力、ナビゲーション)は承認を待ちます。
- 個別に承認するか、「Approve All」を押して残りのステップをエージェントに実行させます。
エージェントは最大10ターンで一時停止するため、無限にループすることはありません。いつでも停止できます。
技術的には、拡張機能はクライアントサイドオーケストレーターとして動作します。会話コンテキストをJieGouサーバーに送信し、サーバーがリクエストをLLMにプロキシします。LLMのツール呼び出し提案はServer-Sent Eventsを介してストリームバックされます。拡張機能はストリームを解析し、各ツール呼び出しを読み取り専用か変更かに分類し、承認フローをローカルで処理します。ツール実行は完全にブラウザ内で行われます——サーバーはページコンテンツを見ません。
フロー記録と再生
AIに何をすべきか考えさせる必要がない場合もあります——以前にやったことを繰り返させるだけです。
サイドパネルで「Record」をクリックし、通常通りブラウザを操作します。ボタンのクリック、フォームの入力、ページ間のナビゲーション。拡張機能は各インタラクションを構造化されたステップとしてキャプチャします:クリック、入力、スクロール、キーボード入力、タブ切り替え。
記録を停止すると、再生可能なフローが得られます。各ステップはブラウザ自動化ツール呼び出し(chrome_click_element、chrome_fill_or_selectなど)にマッピングされるため、再生はrecipeやworkflowと同じ信頼性の高い自動化インフラストラクチャを使用します。
フローは以下をサポートします:
- 変数 —
{{variableName}}プレースホルダーでステップをパラメータ化。ログインフローはユーザー名とパスワードを変数にすることでアカウント間で再利用可能に。 - 速度制御 — 0.5倍、1倍、2倍速で再生
- ステップバイステップモード — 検証のために各ステップ後に一時停止
- エラー時続行 — 停止する代わりに失敗したステップをオプションでスキップ
- 実行履歴 — すべての再生がステップごとの成功/失敗ステータス、タイミング、エラー詳細とともに記録
フローはIndexedDBにローカルに保存されます——基本的な記録と再生にクラウド依存はありません。フローをJSONファイルとしてエクスポートしてチームメートと共有したり、別のマシンにインポートしたりできます。
プラットフォーム固有のインテリジェンス
AIアシスタントは拡張機能の60以上のブラウザ自動化ツールすべてに加え、6つのエンタープライズアプリケーション向けのプラットフォーム固有ハンドラーを継承しています:
- Gmail — スレッドの読み取り、メールの作成、受信トレイの検索
- Slack — メッセージの読み取り、チャネルへの投稿
- Jira — 課題の作成、チケットの更新、スプリントデータの読み取り
- Salesforce — レコードの読み取りと更新
- ServiceNow — インシデントの管理
- HubSpot — 連絡先とキャンペーンへのアクセス
これらのハンドラーは各プラットフォームのDOM構造を理解しているため、AIはセマンティックなレベルで動作します——「div.adn.ads > div:nth-child(3)のセレクタにある要素をクリック」ではなく、「Sarahからの最新のメールを読む」。
プライバシーとセキュリティ
AIアシスタントはブラウザ内で実行されます。ページコンテンツはローカルで抽出され、質問をしたりアクションをトリガーしたりした場合にのみLLMに送信されます。BYOKが適用されます——独自のAPIキーを使用する場合、データはブラウザとLLMプロバイダー間を直接流れます。
チャット履歴、記録されたフロー、カスタムアクション、設定はすべてブラウザのローカルストレージに保存されます。recipeやworkflow実行の一部でない限り、JieGouのサーバーには何も同期されません。
はじめに
JieGouブラウザ拡張機能を最新バージョンにアップデートしてください。AIチャットパネル、コマンドパレット、記録機能はすぐに利用可能です。エージェントモードはProプラン以上でご利用いただけます。ブラウザ拡張機能の詳細を見るか、拡張機能ストアからインストールする。