混合聊天 Agent — 真正在生产环境中有效的解析级联

当今聊天机器人构建器的问题

大多数聊天机器人平台迫使您进入两个阵营之一。阵营一：基于关键词的规则引擎。您定义像”营业时间”或”退款政策”这样的模式，并将它们映射到罐装回复。它们快速、确定性、便宜——但用户换个说法就会失效。“你们几点开门？“匹配，但”周末几点关门？“就不匹配了。

阵营二：把所有东西都扔给 LLM。每条消息都发给 GPT 或 Claude，期望模型做对。它通常确实做对了——但每次对话轮次 2-10 美分，延迟不定，且不保证模型不会编造您的退货政策。

两种方式单独都不适合生产。第一种太僵硬。第二种太贵且不可预测。您真正需要的是一个系统，在每种方式最擅长的地方使用它，只有必要时才落到下一层。

4 层解析级联

JieGou 的聊天 agent 通过 4 层级联解析消息，按顺序评估：

**第 1 层 —— 带嵌入相似性的规则表。**您的规则存储为模式-回复对的表。但与关键词匹配不同，每个模式都作为向量嵌入。消息到达时，被嵌入并与所有规则中心使用余弦相似度进行比较。如果相似度超过可配置的阈值（默认 0.82），匹配的规则立即触发。零 LLM 成本。亚 100 毫秒延迟。确定性输出。

**第 2 层 —— 知识库检索（RAG）。**如果没有规则匹配，消息被路由到您的知识库——上传的文档、FAQ 页面、产品手册。RAG 检索最相关的片段，轻量级 LLM 合成基于您内容的回复。可配置的最低相似度确保低质量检索被过滤。

**第 3 层 —— LLM 回退。**如果 RAG 置信度低于阈值，完整的对话上下文加上您的系统提示被发送到大语言模型。LLM 处理开放式问题、细微请求以及您的规则和知识库未覆盖的任何内容。

**第 4 层 —— 人工升级。**当 LLM 的置信度低，或话题匹配升级触发器（如法律问题、医疗建议、账单争议）时，对话被路由到人工客服，完整上下文保留。

级联不只是优先列表——它是经济优化器。大多数生产流量命中第 1 层或第 2 层。LLM 调用保留给长尾。人工客服只处理真正需要人工的事情。

非技术团队的 CSV 导入

规则表是为真正了解您业务的人设计的——客服主管、诊所管理者、产品专家。他们不写代码。他们写表格。

上传一个两列的 CSV：模式和回复。JieGou 自动嵌入每个模式，为有多个模式变体的规则计算中心，规则表即可上线。需要用同一个回复处理”你们几点营业？”、“什么时候开门？“和”周六开门吗？“？添加三行相同回复。嵌入模型理解同义表达——不需要正则表达式。

规则随时可以更新。重新上传 CSV，嵌入重新计算。无需重新部署。无停机。

带压缩的对话线程

真实对话是多轮的。用户问价格，然后跟进”企业版怎么样？“，然后问”能安排演示吗？“每条消息都依赖之前的内容。

JieGou 维护完整的对话线程并自动压缩。最近的消息逐字保留。较旧的消息由 LLM 摘要以保留上下文，同时保持在令牌限制内。这意味着您的 agent 可以处理 50 轮对话而不会突破上下文窗口或因重复的完整历史提示而产生高成本。

线程状态跨会话持久保存。如果用户第二天回来，agent 从上次中断的地方继续。

多渠道：同一个 Agent，任何平台

构建一次 agent。部署到 LINE、Instagram、WhatsApp、Facebook Messenger 和 YouTube。解析级联、规则表、知识库和对话线程在每个渠道上工作方式完全相同。

渠道特定功能——LINE 富菜单、Instagram 故事回复、WhatsApp 模板消息——在适配层处理。您的 agent 逻辑保持统一。更新一条规则，它在所有渠道立即生效。

这在亚太市场尤其有价值，那里的企业通常同时在 LINE（台湾、日本、泰国）、WhatsApp（东南亚）和 Instagram（全球）上运营。

真实用例：LINE 上的医疗诊所

台湾的一家医疗诊所在 LINE 上部署了 JieGou 聊天 agent，有 200+ 条规则覆盖预约挂号、保险问题、诊所营业时间和交通指引——支持繁体中文和英文。

第 1 层处理 70% 的传入消息：“怎么预约？”、“你们接受健保吗？”、“信义分院在哪？“这些在 100 毫秒内解析，零 LLM 成本。

第 2 层覆盖关于特定手术、准备说明和术后护理的知识库查询——从诊所上传的医疗指南合成。

第 3 层处理开放式问题，如”上周末爬山后我手臂上出了疹子，该怎么办？“LLM 提供一般性指导，同时明确说明这不是医疗建议。

第 4 层将敏感话题——药物相互作用、症状分诊、保险理赔争议——升级到人工工作人员，附带完整对话历史。

完整体系下的治理

JieGou 中的聊天 agent 不是独立的机器人。它们在与每个其他 JieGou agent 相同的治理框架内运作：

RBAC 控制谁可以创建、编辑和部署 agent
审计日志记录每条消息、使用的解析层级和生成的回复
敏感度标签确保医疗或金融对话中的 PHI 和 PII 按策略处理
威胁检测监控聊天消息中的提示注入尝试

您的聊天 agent 智能、快速、成本效益高。而且从第一天就受治理。