为什么通用型 AI Agent 不适合企业自动化

AI 产业正大力推广「agent」——能自主判断该做什么、选择自己的工具、并独立运作的自主系统。这个诉求很吸引人：只要告诉 AI 你想要什么,它就会处理剩下的事。

对于软体开发和开放式研究来说,agent 确实很有用。但对于企业自动化——那些耗费团队时间的重复性任务——它们是错误的抽象概念。

Agent 的承诺 vs. 商业现实

当问题是全新的时候,让 AI agent 决定如何处理问题确实很强大。每个程式开发任务、每个研究问题、每次除错过程都不一样。Agent 赢得自主权是因为没有两个输入是相同的。

企业任务恰恰相反。发票处理每次都遵循相同步骤。潜在客户研究每次都需要相同的输出结构。工单分类每次都使用相同的类别。价值不在于搞清楚该做什么——而在于可靠地大规模执行相同的事情。

当你让 agent「处理这张发票」时,可能会出现几个问题:

Recipe 是具有明确输入和输出的受限提示词。你需要指定:

这种限制是功能特性,而非限制。

当一个 recipe 的输出 schema 包含 vendor_name、invoice_total、line_items 和 discrepancies 时,你每次都知道会得到什么。下游工作流程步骤可以将这些栏位对应到它们的输入。仪表板可以汇整数据。输出是可预测且机器可读的。

Agent 对发票产生的自由格式文字每次都会给你不同的东西。你无法可靠地将其输入到下一步。你无法将其汇整到分析中。你无法在不可预测的输出上建立工作流程。

执行一个 recipe 1,000 次,你会得到 1,000 个具有相同结构的输出。内容会因为输入不同而变化,但格式是一致的。你可以比较输出、追踪品质指标,并识别 AI 效能何时偏移。

执行一个 agent 1,000 次,你会得到 1,000 种不同的方法。有些可能比你的 recipe 更好。许多会更差。你无法衡量一致性,因为没有一致的基准。

对于处理发票、分类工单或评估潜在客户的团队来说,一致性不只是锦上添花——这才是重点。自动化取代了有明确程序的人工流程。AI 需要遵循该程序,而不是即兴发挥。

Agent 是正确的工具当:

JieGou 的对话式 AI 类似 agent——它有工具、做决策,并跟随对话的走向。这对于有人类引导过程的互动式对话是适当的。

但当你排程一个工作流程在每个工作日早上 8 点执行时,没有人类来引导。系统需要遵循明确的程序并产生可预测的输出。那是 recipe,不是 agent。

最有效的方法结合了两种概念:

这让你在需要的地方获得自动化的一致性,在增加价值的地方获得 AI 的灵活性。你不需要 agent 来处理发票。但你可能想要一个来帮助你设计发票处理工作流程。