自社のエージェントについて誰も答えられない質問
長期稼働の AI エージェントを運用しているチームに、シンプルな質問をしてみてください。そのエージェントはあなたのビジネスについて何を記憶していて、それはいつ変わったのか?
ほとんどのチームは答えられません。現在の技術スタックにおけるエージェントメモリは、書き込みが中心で、読み取りは不透明です。事実はセッションから蓄積され、エージェント自身によって要約され、エージェントが下す将来のあらゆる判断をひそかに形作っていきます。3 か月目にエージェントの挙動が変わり始めたとき、記憶された「事実」のどれが、いつ、何によって変わったのかを示す記録はどこにもありません。
パーソナルアシスタントであれば、それは些細な癖にすぎません。しかし、顧客向けメッセージの下書きを作成し、業務をスケジュールし、承認キューに案件を流すエージェントにとっては、ガバナンスの空白です。エージェントのメモリは、統制されたすべてのアウトプットに対する、監査されていないインプットなのです。
メモリキュレーションはネイティブ機能になった。ガバナンスはまだだ。
エージェントプラットフォームの進化は急速です。スケジュールされたメモリキュレーション——メモリストアと直近のセッション履歴を読み取り、重複の統合、古いエントリの削除、パターンの集約のためにメモリを書き換えるバックグラウンドプロセス——は、今やフロンティアスタックのネイティブ機能です。これは本当に有用です。キュレーションされないメモリは劣化し、6 か月分の矛盾したメモの上で推論するエージェントは、クリーンなストアを持つエージェントよりも性能が落ちます。
しかし、ネイティブのキュレーションはブラックボックスとして提供されます。キュレーターはすべてを読み取り、古いと判断したものを書き換え、レビュー可能な編集記録を一切残しません。ガバナンスの観点から見れば、これは他のあらゆる統制のインプット層への書き込み権限を持つ、無人のプロセスです。
統制されたメモリキュレーションとはどのようなものか
当社は今週、JieGou のマネージドエージェント向けにスケジュールされたメモリキュレーションをリリースしました。ネイティブ機能の上に構築し、ネイティブには備わっていないガバナンス層で包んでいます。
- 保護された名前空間。 メモリストアの一部の領域は、キュレーターから完全に隔離されています。運用ステート、エージェント間の共有コンテキスト、スレッドレベルの記録は、モデルがどれほど「古い」と確信していても、キュレーションパスによって書き換えられることはありません。
- サイクルごとの厳格な上限。 キュレーションパスには境界があります。総操作数には固定の上限があり、削除にはさらに低い上限が設けられています。1 回の不適切なサイクルがエージェントの世界観全体を一夜にして書き換えるシナリオは存在しません。大規模な変更には多くのサイクルが必要であり、それは多くのレビュー機会があることを意味します。
- ドライラン・プレビュー。 サイクルはプレビューモードで実行でき、提案された変更の一覧を、何も適用せずにすべて出力します。新規デプロイは、オペレーターが数サイクル分の判断を確認するまでドライランで運用されます。
- 監査可能な差分。 適用されたすべての変更は、レビュー可能な差分として記録されます。何が統合され、何が置き換えられ、何が削除され、どのセッションがその変更の根拠になったのか。この記事の冒頭の質問——何を記憶していて、それはいつ変わったのか——には、どの時点においても具体的な答えがあります。
同じリリースでは、デュアルレーンの成果スコアリングも追加されました。エージェントセッション内で生み出された成果物はネイティブのグレーダーによってセッション内でスコアリングされ、セッション外で作成されたドラフトは当社のジャッジレーンを通ります。エージェントの成果物はすべて成果スコアを獲得し、メモリキュレーションと成果のエビデンスは同じ監査体制の中に収まります。
なぜこれが機能の枠を超えて重要なのか
ここには名前を付けておくべきパターンがあります。エージェントプラットフォームが成熟するにつれ、かつてインテグレーターの仕事だった機能——メモリ、スコアリング、スケジューリング——がネイティブのプリミティブになっていきます。それは良いことです。モデル層とそのプリミティブは、コモディティ化したインフラになりつつあります。
コモディティ化しないのは、ガバナンスの外殻です。スコープの限定、上限、承認ゲート、再生可能な記録。ネイティブのメモリキュレーションは、統制されていないエージェントを「統制されていないまま、より優秀」にするだけです。実際の顧客データに対してエージェントを運用するチームにとっての運用上の問いは、ネイティブのプリミティブを使うべきかどうかではなく——使うべきです——エージェントのステートに書き込むすべてのプリミティブが、監査人、保険引受人、あるいは未来の自分自身がレビューできるエビデンスを残しているかどうかです。
上限が設けられ、差分が記録され、再生可能な操作によってのみ変化するメモリ。それが当社の答えです。現在のエージェントスタックが「先月の記憶と今日の記憶の差分」を見せられないのであれば、そのメモリが重要な意味を持ち始める前に、修正しておく価値があります。