实际运行 AI 工作流的成本(附真实数据)

「这要花多少钱?」是关于 AI 自动化最难回答的问题。Token 定价是以百万计、不同模型对输入和输出收费不同,而单次执行的成本取决于输入和输出的文字量。大多数团队要么忽视成本直到帐单到来,要么过度优化而在所有地方都使用最便宜的模型。

这两种方法都不可行。以下是实务角度思考 AI 工作流成本的方式。

基础知识:单次 recipe 执行的成本

一次 recipe 执行有两个成本组成:输入 tokens(你的提示词 + 上下文)和输出 tokens(AI 的回应)。输出 tokens 通常比输入 tokens 贵 3-5 倍。

以下是不同供应商的典型 recipe 执行成本(大约值,截至 2026 年初):

简单提取或分类(输入短、结构化输出):

Claude Haiku 4.5:每次执行约 $0.002-0.005
GPT-5-mini:每次执行约 $0.002-0.004
Gemini 2.5 Flash Lite:每次执行约 $0.001-0.003

内容生成(中等输入、较长输出):

Claude Sonnet 4.5:每次执行约 $0.01-0.03
GPT-5.1:每次执行约 $0.01-0.025
Gemini 2.5 Pro:每次执行约 $0.008-0.02

复杂分析与延伸思考(长输入、推理 + 输出):

Claude Opus 4.5:每次执行约 $0.05-0.15
o3:每次执行约 $0.04-0.12
Gemini 3 Pro:每次执行约 $0.03-0.10

这些是粗略范围。实际成本取决于输入长度、输出长度,以及是否启用网路搜寻或延伸思考等功能。

工作流的成本

工作流会串接多个 recipes。成本是所有步骤成本的总和。以下是一个实际范例:

发票处理工作流(4 个步骤):

提取发票资料(Haiku 4.5):$0.003
检查差异(Sonnet 4.5):$0.015
生成核准摘要(Haiku 4.5):$0.002
撰写最终报告(Sonnet 4.5):$0.02

每次执行总成本:约 $0.04

每周执行 50 次(每天 10 张发票),月成本约 $8。相较之下,人工处理每张发票需要财务团队成员 15-20 分钟——每周约 12 小时的工作量。

新潜在客户管线(4 个步骤含网路搜寻):

潜在客户研究与网路搜寻(Sonnet 4.5):$0.04
潜在客户资格审查(Haiku 4.5):$0.005
条件检查:免费(仅逻辑,无 AI 呼叫)
草拟开发信(Sonnet 4.5):$0.02

每次执行总成本:约 $0.065

每月处理 200 个潜在客户,AI 成本约 $13/月。

优化杠杆:逐步骤选择模型

JieGou 最大的成本优化不是到处使用更便宜的模型——而是为每个步骤使用正确的模型。

在上述发票工作流中,提取和核准摘要使用 Haiku(快速、便宜、擅长结构化任务)。差异检查和最终报告使用 Sonnet(更好的推理、更好的文字表达)。如果所有步骤都使用 Opus,工作流每次执行成本会达到约 $0.35 而非 $0.04——在较简单步骤上品质提升微乎其微,成本却高出近 10 倍。

JieGou 让你能为每个 recipe 独立设定模型,因此你可以在步骤层级优化,而无需改变工作流结构。

执行前估算成本

JieGou 内建成本估算器,可在执行工作流前预估执行成本。估算器使用每个 recipe 过往执行的历史 token 用量来预测目前执行的成本。

对于没有历史纪录的新 recipes,估算器会根据输入和输出 schema 大小使用特定模型的预设值。

执行后追踪成本

分析仪表板会按以下方式细分 token 用量和成本:

Recipe — 哪些 recipes 每次执行最昂贵?
工作流 — 每个工作流的总成本是多少?
部门 — 每个团队花费多少?
模型 — 各供应商的成本分布如何?

这种可见性让你发现优化机会。如果某个 recipe 占工作流成本的 60%,那就是实验不同模型或更短提示词的地方。

月度成本全貌

对于执行中等程度自动化的团队:

工作负载	每月执行次数	预估成本
销售潜在客户管线	200	$13
行销内容再利用	20	$1.50
客服工单分流	800	$4
每周交易审查	4	$0.80
发票处理	200	$8

总计:每月约 $27 的 AI 供应商成本。 这是实际的 token 成本,直接支付给供应商。JieGou 的平台订阅费用是分开计算的,不包含 AI 加成。

将此与被取代的人工时间相比——团队每周数十小时——ROI 显而易见。

实用经验法则

使用能产生可接受输出的最便宜模型。 对于分流、提取和分类,Haiku 或 GPT-5-mini 通常就足够。将 Opus 和 o3 留给复杂分析和高风险内容。
更短的提示词成本更低。 一个简洁的提示词模板,明确告诉 AI 要做什么,比冗长且充满范例和警告的提示词便宜。
结构化输出 schemas 减少浪费。 当 AI 明确知道要填写哪些栏位时,会产生更短、更聚焦的输出。更少的输出 = 更低的成本。
网路搜寻会增加成本。 搜寻本身包含在模型定价中,但搜寻结果会增加输入上下文。只为需要最新资讯的 recipes 启用网路搜寻。