ハイブリッドチャットエージェント -- 本番で実際に機能するレゾリューションカスケード

ルールは高速ですが脆弱。LLMは柔軟ですが高価。JieGouの4層レゾリューションカスケードはルールテーブル、RAG、LLMフォールバック、人間エスカレーションを1つのチャットエージェントに組み合わせ、信頼性とインテリジェンスを両立させます。

JieGou Team · 2026年3月4日 · 1 分で読めます

今日のチャットボットビルダーの問題

ほとんどのチャットボットプラットフォームは2つの陣営のいずれかを強制します。陣営1：キーワードベースのルールエンジン。「営業時間」や「返金ポリシー」のようなパターンを定義し、定型応答にマッピングします。高速、決定論的、安価ですが、ユーザーが異なる言い方をした瞬間に壊れます。

陣営2：すべてをLLMに投げます。すべてのメッセージがGPTやClaudeに送られ、モデルが正しく答えることを願います。多くの場合うまくいきますが、会話ターンあたり2〜10セントで、可変レイテンシがあり、モデルが返品ポリシーをハルシネーションしない保証はありません。

どちらのアプローチも単独では本番対応できません。

4層レゾリューションカスケード

JieGouのチャットエージェントは4層カスケードを通じてメッセージを解決します：

Tier 1 — エンベディング類似度付きルールテーブル。 ルールはパターン-応答ペアのテーブルとして保存されます。キーワードマッチングとは異なり、各パターンはベクトルとして埋め込まれます。メッセージが到着すると、すべてのルールセントロイドとコサイン類似度で比較されます。類似度が設定可能な閾値（デフォルト0.82）を超えると、マッチしたルールが即座に発火します。LLMコストゼロ。100ms未満のレイテンシ。決定論的な出力。

Tier 2 — ナレッジベース検索（RAG）。 ルールがマッチしない場合、メッセージはナレッジベースにルーティングされます。RAGが最も関連するチャンクを検索し、軽量LLMがコンテンツに基づいた応答を合成します。

Tier 3 — LLMフォールバック。 RAGの信頼度が閾値を下回る場合、完全な会話コンテキストとシステムプロンプトが大規模言語モデルに送信されます。

Tier 4 — 人間エスカレーション。 LLMの信頼度が低い場合、またはトピックがエスカレーショントリガーにマッチする場合、会話は完全なコンテキストが保持された状態で人間のエージェントにルーティングされます。

カスケードは単なる優先順位リストではなく、経済的オプティマイザーです。本番トラフィックの大部分がTier 1またはTier 2にヒットします。

非技術チーム向けCSVインポート

ルールテーブルはビジネスを実際に知っている人のために設計されています。パターンと応答の2列のCSVをアップロードするだけです。JieGouがすべてのパターンを自動埋め込みし、複数のパターンバリアントを持つルールのセントロイドを計算し、ルールテーブルが即座に有効になります。

会話スレッディングとコンパクション

JieGouは自動コンパクション付きの完全な会話スレッドを維持します。最近のメッセージはそのまま保持。古いメッセージはLLMによって要約され、トークン制限内でコンテキストを保持します。

マルチチャネル：同じエージェント、任意のプラットフォーム

エージェントを1回構築。LINE、Instagram、WhatsApp、Facebook Messenger、YouTubeにデプロイ。レゾリューションカスケード、ルールテーブル、ナレッジベース、会話スレッドがすべてのチャネルで同一に機能します。

実際のユースケース：LINE上のヘルスケアクリニック

台湾の医療クリニックがJieGouチャットエージェントをLINE上にデプロイし、予約スケジューリング、保険の質問、クリニック営業時間、道案内をカバーする200以上のルールを持ちます。

Tier 1が受信メッセージの70%を処理。Tier 2がナレッジベースクエリをカバー。Tier 3がオープンエンドの質問を処理。Tier 4が機密トピックを人間スタッフにエスカレーション。

フルスタックでガバナンス

JieGouのチャットエージェントはスタンドアロンボットではありません。他のすべてのJieGouエージェントと同じガバナンスフレームワーク内で動作します：

RBACがエージェントの作成、編集、デプロイを制御
監査ログがすべてのメッセージ、使用されたレゾリューションティア、生成された応答を記録
感度ラベルが医療または財務会話におけるPHIとPIIをポリシーに従って処理
脅威検出がチャットメッセージ内のプロンプトインジェクション試行を監視