AI 产业正大力推广「agent」——能自主判断该做什么、选择自己的工具、并独立运作的自主系统。这个诉求很吸引人:只要告诉 AI 你想要什么,它就会处理剩下的事。
对于软体开发和开放式研究来说,agent 确实很有用。但对于企业自动化——那些耗费团队时间的重复性任务——它们是错误的抽象概念。
Agent 的承诺 vs. 商业现实
当问题是全新的时候,让 AI agent 决定如何处理问题确实很强大。每个程式开发任务、每个研究问题、每次除错过程都不一样。Agent 赢得自主权是因为没有两个输入是相同的。
企业任务恰恰相反。发票处理每次都遵循相同步骤。潜在客户研究每次都需要相同的输出结构。工单分类每次都使用相同的类别。价值不在于搞清楚该做什么——而在于可靠地大规模执行相同的事情。
当你让 agent「处理这张发票」时,可能会出现几个问题:
- 它可能每次决定提取不同的栏位,导致下游系统故障
- 它可能选择不同的差异检查方法,产生不一致的结果
- 它可能包含你没要求的评论,或遗漏你需要的栏位
- 根据它决定做什么,它可能一次花 30 秒,下次却花 3 分钟
为什么结构化 recipe 更适合企业
Recipe 是具有明确输入和输出的受限提示词。你需要指定:
- 输入内容 — 定义输入栏位、类型和描述的 schema
- 执行过程 — 明确告诉 AI 该做什么的提示词模板
- 输出内容 — 定义回应结构的输出 schema
这种限制是功能特性,而非限制。
当一个 recipe 的输出 schema 包含 vendor_name、invoice_total、line_items 和 discrepancies 时,你每次都知道会得到什么。下游工作流程步骤可以将这些栏位对应到它们的输入。仪表板可以汇整数据。输出是可预测且机器可读的。
Agent 对发票产生的自由格式文字每次都会给你不同的东西。你无法可靠地将其输入到下一步。你无法将其汇整到分析中。你无法在不可预测的输出上建立工作流程。
大规模的一致性
执行一个 recipe 1,000 次,你会得到 1,000 个具有相同结构的输出。内容会因为输入不同而变化,但格式是一致的。你可以比较输出、追踪品质指标,并识别 AI 效能何时偏移。
执行一个 agent 1,000 次,你会得到 1,000 种不同的方法。有些可能比你的 recipe 更好。许多会更差。你无法衡量一致性,因为没有一致的基准。
对于处理发票、分类工单或评估潜在客户的团队来说,一致性不只是锦上添花——这才是重点。自动化取代了有明确程序的人工流程。AI 需要遵循该程序,而不是即兴发挥。
何时 Agent 才有意义
Agent 是正确的工具当:
- 每次任务都是全新的(程式开发、研究、除错)
- 探索本身就是目的(范围未知的分析)
- 使用者在场并能引导(互动式对话)
JieGou 的对话式 AI 类似 agent——它有工具、做决策,并跟随对话的走向。这对于有人类引导过程的互动式对话是适当的。
但当你排程一个工作流程在每个工作日早上 8 点执行时,没有人类来引导。系统需要遵循明确的程序并产生可预测的输出。那是 recipe,不是 agent。
中间地带
最有效的方法结合了两种概念:
- 结构化 recipe 用于可重复的部分——80% 遵循模式的工作
- 人工判断 用于决策点——审批关卡、条件分支、人工审查
- 对话式 AI 用于探索性部分——临时问题、脑力激荡、一次性分析
这让你在需要的地方获得自动化的一致性,在增加价值的地方获得 AI 的灵活性。你不需要 agent 来处理发票。但你可能想要一个来帮助你设计发票处理工作流程。