混合式聊天代理 — 真正適用於生產環境的解析瀑布流

當今聊天機器人平台的問題

大多數聊天機器人平台迫使你選擇兩個陣營之一。第一陣營：基於關鍵字的規則引擎。你定義「營業時間」或「退款政策」等模式，並對應罐頭回覆。它們快速、確定性高、成本低 — 但只要使用者換個說法就會失效。「你們幾點開門？」能匹配，但「週末幾點關門？」就不行了。

第二陣營：把所有訊息丟給 LLM。每條訊息都送到 GPT 或 Claude，期望模型能答對。通常確實可以 — 但每次對話輪次花費 2-10 美分，延遲不穩定，而且無法保證模型不會幻覺出你的退款政策。

兩種方式單獨使用都無法滿足生產需求。第一種太僵化，第二種太昂貴且不可預測。你真正需要的是一個系統，讓每種方式在其擅長之處發揮作用，只有在必要時才降級到下一層。

4 層解析瀑布流

JieGou 的聊天代理透過 4 層瀑布流依序解析訊息：

第 1 層 — 基於嵌入相似度的規則表。 你的規則儲存為模式-回覆配對表。但與關鍵字匹配不同，每個模式都被嵌入為向量。當訊息到達時，系統將其嵌入並使用餘弦相似度與所有規則質心進行比較。如果相似度超過可配置的閾值（預設 0.82），匹配的規則立即觸發。零 LLM 成本。低於 100 毫秒的延遲。確定性輸出。

第 2 層 — 知識庫檢索 (RAG)。 如果沒有規則匹配，訊息會路由到你的知識庫 — 上傳的文件、FAQ 頁面、產品手冊。RAG 檢索最相關的片段，輕量級 LLM 基於你的內容合成回覆。可配置的最低相似度確保低品質的檢索結果被過濾掉。

第 3 層 — LLM 後備。 如果 RAG 信心值低於閾值，完整的對話上下文加上你的系統提示會發送給大型語言模型。LLM 處理開放式問題、細膩的需求，以及你的規則和知識庫未涵蓋的任何內容。

第 4 層 — 人工轉接。 當 LLM 的信心值較低，或當主題匹配轉接觸發條件（例如法律問題、醫療建議、帳單爭議）時，對話會轉接給人工客服，並保留完整的對話上下文。

瀑布流不僅是優先順序列表 — 它是經濟最佳化器。大多數生產流量命中第 1 層或第 2 層。LLM 呼叫保留給長尾需求。人工客服只處理真正需要人工介入的問題。

非技術團隊適用的 CSV 匯入

規則表是為真正了解你業務的人設計的 — 客服主管、診所管理者、產品專家。他們不寫程式碼，他們寫試算表。

上傳一個包含兩欄的 CSV：模式和回覆。JieGou 自動嵌入每個模式，為具有多個模式變體的規則計算質心，規則表即時生效。需要用同一個回覆處理「你們營業時間是？」、「幾點開門？」和「週六有營業嗎？」？新增三行相同回覆即可。嵌入模型理解改述 — 不需要正則表達式。

規則可以隨時更新。重新上傳 CSV，嵌入會重新計算。無需重新部署，無需停機。

對話串接與壓縮

真實對話是多輪的。使用者先問價格，接著追問「企業方案呢？」，然後問「可以安排展示嗎？」每條訊息都依賴之前的內容。

JieGou 維護完整的對話串並進行自動壓縮。近期訊息完整保留，較早的訊息由 LLM 摘要以保留上下文，同時控制在令牌限制之內。這意味著你的代理可以處理 50 輪對話，而不會超出上下文視窗或因重複發送完整歷史記錄而累積成本。

對話狀態跨工作階段持久化。如果使用者隔天回來，代理會從上次中斷的地方繼續。

多通路：同一代理，任何平台

建構一次代理，部署到 LINE、Instagram、WhatsApp、Facebook Messenger 和 YouTube。解析瀑布流、規則表、知識庫和對話串在每個通路上的運作方式完全相同。

通路特定功能 — LINE 圖文選單、Instagram 限動回覆、WhatsApp 範本訊息 — 在轉接層處理。你的代理邏輯保持統一。更新一條規則，即在所有通路生效。

這對亞太市場尤其有價值，因為企業通常同時在 LINE（台灣、日本、泰國）、WhatsApp（東南亞）和 Instagram（全球）上營運。

真實案例：LINE 上的醫療診所

一家台灣醫療診所在 LINE 上部署了 JieGou 聊天代理，包含 200 多條規則，涵蓋預約掛號、保險問題、門診時間和交通指引 — 同時支援繁體中文和英文。

第 1 層處理 70% 的進線訊息：「如何預約？」、「你們接受健保嗎？」、「信義分院在哪裡？」這些在 100 毫秒內解析完成，零 LLM 成本。

第 2 層涵蓋關於特定療程、術前準備和術後照護的知識庫查詢 — 從診所上傳的醫療指南中合成。

第 3 層處理開放式問題，例如「我上週末健行後手臂出現紅疹，該怎麼辦？」LLM 提供一般性指引，同時明確聲明這不是醫療建議。

第 4 層將敏感主題 — 藥物交互作用、症狀分流、保險理賠爭議 — 轉接給人工人員，並附上完整的對話歷史。

受完整治理堆疊保護

JieGou 中的聊天代理不是獨立的機器人。它們在與所有其他 JieGou 代理相同的治理框架中運作：

RBAC 控制誰可以建立、編輯和部署代理
審計日誌 記錄每條訊息、使用的解析層級和生成的回覆
敏感度標籤 確保醫療或金融對話中的 PHI 和 PII 按照政策處理
威脅偵測 監控聊天訊息中的提示注入嘗試

你的聊天代理智慧、快速且經濟實惠。而且從第一天起就受到治理。