AI 產業正大力推廣「agent」——能自主判斷該做什麼、選擇自己的工具、並獨立運作的自主系統。這個訴求很吸引人:只要告訴 AI 你想要什麼,它就會處理剩下的事。
對於軟體開發和開放式研究來說,agent 確實很有用。但對於企業自動化——那些耗費團隊時間的重複性任務——它們是錯誤的抽象概念。
Agent 的承諾 vs. 商業現實
當問題是全新的時候,讓 AI agent 決定如何處理問題確實很強大。每個程式開發任務、每個研究問題、每次除錯過程都不一樣。Agent 贏得自主權是因為沒有兩個輸入是相同的。
企業任務恰恰相反。發票處理每次都遵循相同步驟。潛在客戶研究每次都需要相同的輸出結構。工單分類每次都使用相同的類別。價值不在於搞清楚該做什麼——而在於可靠地大規模執行相同的事情。
當你讓 agent「處理這張發票」時,可能會出現幾個問題:
- 它可能每次決定提取不同的欄位,導致下游系統故障
- 它可能選擇不同的差異檢查方法,產生不一致的結果
- 它可能包含你沒要求的評論,或遺漏你需要的欄位
- 根據它決定做什麼,它可能一次花 30 秒,下次卻花 3 分鐘
為什麼結構化 recipe 更適合企業
Recipe 是具有明確輸入和輸出的受限提示詞。你需要指定:
- 輸入內容 — 定義輸入欄位、類型和描述的 schema
- 執行過程 — 明確告訴 AI 該做什麼的提示詞模板
- 輸出內容 — 定義回應結構的輸出 schema
這種限制是功能特性,而非限制。
當一個 recipe 的輸出 schema 包含 vendor_name、invoice_total、line_items 和 discrepancies 時,你每次都知道會得到什麼。下游工作流程步驟可以將這些欄位對應到它們的輸入。儀表板可以彙整數據。輸出是可預測且機器可讀的。
Agent 對發票產生的自由格式文字每次都會給你不同的東西。你無法可靠地將其輸入到下一步。你無法將其彙整到分析中。你無法在不可預測的輸出上建立工作流程。
大規模的一致性
執行一個 recipe 1,000 次,你會得到 1,000 個具有相同結構的輸出。內容會因為輸入不同而變化,但格式是一致的。你可以比較輸出、追蹤品質指標,並識別 AI 效能何時偏移。
執行一個 agent 1,000 次,你會得到 1,000 種不同的方法。有些可能比你的 recipe 更好。許多會更差。你無法衡量一致性,因為沒有一致的基準。
對於處理發票、分類工單或評估潛在客戶的團隊來說,一致性不只是錦上添花——這才是重點。自動化取代了有明確程序的人工流程。AI 需要遵循該程序,而不是即興發揮。
何時 Agent 才有意義
Agent 是正確的工具當:
- 每次任務都是全新的(程式開發、研究、除錯)
- 探索本身就是目的(範圍未知的分析)
- 使用者在場並能引導(互動式對話)
JieGou 的對話式 AI 類似 agent——它有工具、做決策,並跟隨對話的走向。這對於有人類引導過程的互動式對話是適當的。
但當你排程一個工作流程在每個工作日早上 8 點執行時,沒有人類來引導。系統需要遵循明確的程序並產生可預測的輸出。那是 recipe,不是 agent。
中間地帶
最有效的方法結合了兩種概念:
- 結構化 recipe 用於可重複的部分——80% 遵循模式的工作
- 人工判斷 用於決策點——審批關卡、條件分支、人工審查
- 對話式 AI 用於探索性部分——臨時問題、腦力激盪、一次性分析
這讓你在需要的地方獲得自動化的一致性,在增加價值的地方獲得 AI 的靈活性。你不需要 agent 來處理發票。但你可能想要一個來幫助你設計發票處理工作流程。