當今聊天機器人平台的問題
大多數聊天機器人平台迫使你選擇兩個陣營之一。第一陣營:基於關鍵字的規則引擎。你定義「營業時間」或「退款政策」等模式,並對應罐頭回覆。它們快速、確定性高、成本低 — 但只要使用者換個說法就會失效。「你們幾點開門?」能匹配,但「週末幾點關門?」就不行了。
第二陣營:把所有訊息丟給 LLM。每條訊息都送到 GPT 或 Claude,期望模型能答對。通常確實可以 — 但每次對話輪次花費 2-10 美分,延遲不穩定,而且無法保證模型不會幻覺出你的退款政策。
兩種方式單獨使用都無法滿足生產需求。第一種太僵化,第二種太昂貴且不可預測。你真正需要的是一個系統,讓每種方式在其擅長之處發揮作用,只有在必要時才降級到下一層。
4 層解析瀑布流
JieGou 的聊天代理透過 4 層瀑布流依序解析訊息:
第 1 層 — 基於嵌入相似度的規則表。 你的規則儲存為模式-回覆配對表。但與關鍵字匹配不同,每個模式都被嵌入為向量。當訊息到達時,系統將其嵌入並使用餘弦相似度與所有規則質心進行比較。如果相似度超過可配置的閾值(預設 0.82),匹配的規則立即觸發。零 LLM 成本。低於 100 毫秒的延遲。確定性輸出。
第 2 層 — 知識庫檢索 (RAG)。 如果沒有規則匹配,訊息會路由到你的知識庫 — 上傳的文件、FAQ 頁面、產品手冊。RAG 檢索最相關的片段,輕量級 LLM 基於你的內容合成回覆。可配置的最低相似度確保低品質的檢索結果被過濾掉。
第 3 層 — LLM 後備。 如果 RAG 信心值低於閾值,完整的對話上下文加上你的系統提示會發送給大型語言模型。LLM 處理開放式問題、細膩的需求,以及你的規則和知識庫未涵蓋的任何內容。
第 4 層 — 人工轉接。 當 LLM 的信心值較低,或當主題匹配轉接觸發條件(例如法律問題、醫療建議、帳單爭議)時,對話會轉接給人工客服,並保留完整的對話上下文。
瀑布流不僅是優先順序列表 — 它是經濟最佳化器。大多數生產流量命中第 1 層或第 2 層。LLM 呼叫保留給長尾需求。人工客服只處理真正需要人工介入的問題。
非技術團隊適用的 CSV 匯入
規則表是為真正了解你業務的人設計的 — 客服主管、診所管理者、產品專家。他們不寫程式碼,他們寫試算表。
上傳一個包含兩欄的 CSV:模式和回覆。JieGou 自動嵌入每個模式,為具有多個模式變體的規則計算質心,規則表即時生效。需要用同一個回覆處理「你們營業時間是?」、「幾點開門?」和「週六有營業嗎?」?新增三行相同回覆即可。嵌入模型理解改述 — 不需要正則表達式。
規則可以隨時更新。重新上傳 CSV,嵌入會重新計算。無需重新部署,無需停機。
對話串接與壓縮
真實對話是多輪的。使用者先問價格,接著追問「企業方案呢?」,然後問「可以安排展示嗎?」每條訊息都依賴之前的內容。
JieGou 維護完整的對話串並進行自動壓縮。近期訊息完整保留,較早的訊息由 LLM 摘要以保留上下文,同時控制在令牌限制之內。這意味著你的代理可以處理 50 輪對話,而不會超出上下文視窗或因重複發送完整歷史記錄而累積成本。
對話狀態跨工作階段持久化。如果使用者隔天回來,代理會從上次中斷的地方繼續。
多通路:同一代理,任何平台
建構一次代理,部署到 LINE、Instagram、WhatsApp、Facebook Messenger 和 YouTube。解析瀑布流、規則表、知識庫和對話串在每個通路上的運作方式完全相同。
通路特定功能 — LINE 圖文選單、Instagram 限動回覆、WhatsApp 範本訊息 — 在轉接層處理。你的代理邏輯保持統一。更新一條規則,即在所有通路生效。
這對亞太市場尤其有價值,因為企業通常同時在 LINE(台灣、日本、泰國)、WhatsApp(東南亞)和 Instagram(全球)上營運。
真實案例:LINE 上的醫療診所
一家台灣醫療診所在 LINE 上部署了 JieGou 聊天代理,包含 200 多條規則,涵蓋預約掛號、保險問題、門診時間和交通指引 — 同時支援繁體中文和英文。
第 1 層處理 70% 的進線訊息:「如何預約?」、「你們接受健保嗎?」、「信義分院在哪裡?」這些在 100 毫秒內解析完成,零 LLM 成本。
第 2 層涵蓋關於特定療程、術前準備和術後照護的知識庫查詢 — 從診所上傳的醫療指南中合成。
第 3 層處理開放式問題,例如「我上週末健行後手臂出現紅疹,該怎麼辦?」LLM 提供一般性指引,同時明確聲明這不是醫療建議。
第 4 層將敏感主題 — 藥物交互作用、症狀分流、保險理賠爭議 — 轉接給人工人員,並附上完整的對話歷史。
受完整治理堆疊保護
JieGou 中的聊天代理不是獨立的機器人。它們在與所有其他 JieGou 代理相同的治理框架中運作:
- RBAC 控制誰可以建立、編輯和部署代理
- 審計日誌 記錄每條訊息、使用的解析層級和生成的回覆
- 敏感度標籤 確保醫療或金融對話中的 PHI 和 PII 按照政策處理
- 威脅偵測 監控聊天訊息中的提示注入嘗試
你的聊天代理智慧、快速且經濟實惠。而且從第一天起就受到治理。