當我們最初推出 JieGou 瀏覽器擴充功能時,它是一個工具執行器。Recipe 和 workflow 可以透過 Model Context Protocol 調用 60 多種瀏覽器自動化工具——點擊、讀取、填寫表單。功能強大,但屬於被動式。擴充功能只會在 recipe 指示時才執行動作。
如今,擴充功能已成為一個獨立的 AI 助手。開啟側邊面板,針對您正在瀏覽的頁面提出問題,即可獲得理解螢幕內容的回答。使用指令面板一鍵執行動作。讓代理自主接管瀏覽器進行操作。錄製您的瀏覽器互動並在之後重播。
具備頁面感知的 AI 對話
點擊擴充功能圖示或使用鍵盤快捷鍵開啟側邊面板。輸入問題,AI 會在完全理解您當前頁面的前提下做出回應。
擴充功能不僅僅讀取 URL。它會提取頁面的文字內容(最多 8,000 個字元),並偵測您正在使用的平台——Gmail、Slack、Jira、Salesforce、Confluence、ServiceNow、LinkedIn 或 HubSpot。平台偵測會觸發專門的上下文提取,因此 AI 能理解您正在查看的是一張 Jira 工作項或一個 Gmail 對話串,而不僅僅是一個普通網頁。
對話記錄在面板開關之間持續保留。關閉側邊面板、瀏覽其他頁面、重新開啟——您的聊天記錄仍在。最多 50 條訊息會儲存在您的瀏覽器本機,除非您明確要求 AI 執行操作,否則任何資料都不會離開您的裝置。
提供兩種模式:標準對話模式用於問答,代理模式用於多步驟操作(詳見下文)。只需一次點擊即可在兩者之間切換。
指令面板:Cmd+Shift+K
按下 Cmd+Shift+K(Mac)或 Ctrl+Shift+K(Windows/Linux),會出現一個可搜尋的指令面板,內含 10 個內建動作:
頁面操作:
- 擷取頁面截圖 — 將可見視窗擷取為 PNG 並複製到剪貼簿
- 複製為 Markdown — 將頁面內容提取為整潔的 Markdown 格式
- 提取所有連結 — 擷取頁面中的所有連結
- 表格匯出為 CSV — 將 HTML 表格轉換為 CSV 格式
- 儲存至記事本 — 將內容儲存到本機儲存空間以便稍後使用
AI 操作:
- 摘要頁面 — AI 生成當前頁面的摘要
- 提取結構化資料 — 從非結構化內容中擷取結構化資訊
- 草擬回覆 — 生成上下文相關的回覆(適用於電子郵件和對話串)
- 解釋此內容 — 以淺顯易懂的方式解釋技術內容
導覽:
- 搜尋已開啟的分頁 — 在所有已開啟的瀏覽器分頁中進行模糊搜尋
輸入文字進行篩選,使用方向鍵導覽,按 Enter 執行。結果會自動複製到您的剪貼簿。
除了內建動作之外,您還可以建立自訂動作。定義一個包含 {selectedText}、{pageUrl} 和 {pageTitle} 等變數的提示範本,您的動作就會與預設動作一起出現在指令面板中。如果您的團隊有標準化的方式來摘要客服工單或從會議記錄中提取待辦事項,將其儲存為自訂動作,就能隨時一鍵調用。
自主瀏覽
標準對話模式回答問題。代理模式則主動執行操作。
當您啟用代理模式時,AI 會進入多輪迴圈。它可以提議瀏覽器工具調用——點擊這個按鈕、填寫那個表單、導覽到另一個頁面——擴充功能會在您批准後執行這些操作。
以下是審批流程的運作方式:
- 您輸入指令:「找到我信箱中最新的發票,並轉寄給 accounting@company.com」
- AI 規劃其方法並提議工具調用:導覽到 Gmail、搜尋「發票」、開啟最新結果
- 每個工具調用會以卡片形式顯示動作名稱和參數。唯讀工具(讀取頁面內容、擷取截圖)會自動執行。變更工具(點擊、輸入、導覽)則等待您的批准。
- 逐一批准,或點擊「全部批准」讓代理執行剩餘步驟。
代理最多執行 10 個回合後會暫停,因此不會無限迴圈。您可以隨時停止。
從技術角度來看,擴充功能充當客戶端編排器。它將對話上下文發送到 JieGou 伺服器,伺服器將請求代理轉發給 LLM。LLM 的工具調用提議透過 Server-Sent Events 串流回傳。擴充功能解析串流,將每個工具調用分類為唯讀或變更操作,並在本機處理審批流程。工具執行完全在您的瀏覽器中進行——伺服器永遠不會看到頁面內容。
流程錄製與重播
有時您不需要 AI 來決定該做什麼——您只需要它重複您已經做過的事情。
在側邊面板中點擊「錄製」,然後正常使用您的瀏覽器。點擊按鈕、填寫表單、在頁面之間導覽。擴充功能會將每次互動擷取為結構化步驟:點擊、填寫、捲動、鍵盤輸入、分頁切換。
當您停止錄製時,就會獲得一個可重播的流程。每個步驟都對應一個瀏覽器自動化工具調用(chrome_click_element、chrome_fill_or_select 等),因此重播使用的是與 recipe 和 workflow 相同的可靠自動化基礎架構。
流程支援:
- 變數 — 使用
{{variableName}}佔位符將步驟參數化。登入流程可以透過將使用者名稱和密碼轉換為變數,在不同帳戶間重複使用。 - 速度控制 — 以 0.5 倍、1 倍或 2 倍速播放
- 逐步模式 — 每個步驟後暫停以進行驗證
- 錯誤時繼續 — 可選擇跳過失敗的步驟而非停止
- 執行歷史 — 每次重播都會記錄每個步驟的成功/失敗狀態、計時和錯誤詳情
流程儲存在本機的 IndexedDB 中——基本的錄製和重播不依賴雲端。您可以將流程匯出為 JSON 檔案與團隊成員分享,或在另一台電腦上匯入使用。
平台專用智慧
AI 助手繼承了擴充功能的所有 60 多種瀏覽器自動化工具,以及針對六個企業應用程式的平台專用處理器:
- Gmail — 讀取對話串、撰寫電子郵件、搜尋收件匣
- Slack — 讀取訊息、發布到頻道
- Jira — 建立問題、更新工作項、讀取衝刺資料
- Salesforce — 讀取和更新記錄
- ServiceNow — 管理事件
- HubSpot — 存取聯絡人和行銷活動
這些處理器理解每個平台的 DOM 結構,因此 AI 在語意層級上運作——「讀取 Sarah 最新的電子郵件」,而不是「點擊選擇器 div.adn.ads > div:nth-child(3) 的元素」。
隱私與安全
AI 助手在您的瀏覽器中運行。頁面內容在本機提取,只有在您提出問題或觸發操作時才會發送給 LLM。BYOK 適用——如果您使用自己的 API 金鑰,資料會直接在您的瀏覽器和 LLM 供應商之間流動。
聊天記錄、錄製的流程、自訂動作和設定全部儲存在您瀏覽器的本機儲存空間中。除非是 recipe 或 workflow 執行的一部分,否則不會同步到 JieGou 的伺服器。
開始使用
將您的 JieGou 瀏覽器擴充功能更新至最新版本。AI 對話面板、指令面板和錄製功能即刻可用。代理模式適用於 Pro 方案及以上。深入了解瀏覽器擴充功能或從擴充功能商店安裝。