「这要花多少钱?」是关于 AI 自动化最难回答的问题。Token 定价是以百万计、不同模型对输入和输出收费不同,而单次执行的成本取决于输入和输出的文字量。大多数团队要么忽视成本直到帐单到来,要么过度优化而在所有地方都使用最便宜的模型。
这两种方法都不可行。以下是实务角度思考 AI 工作流成本的方式。
基础知识:单次 recipe 执行的成本
一次 recipe 执行有两个成本组成:输入 tokens(你的提示词 + 上下文)和输出 tokens(AI 的回应)。输出 tokens 通常比输入 tokens 贵 3-5 倍。
以下是不同供应商的典型 recipe 执行成本(大约值,截至 2026 年初):
简单提取或分类(输入短、结构化输出):
- Claude Haiku 4.5:每次执行约 $0.002-0.005
- GPT-5-mini:每次执行约 $0.002-0.004
- Gemini 2.5 Flash Lite:每次执行约 $0.001-0.003
内容生成(中等输入、较长输出):
- Claude Sonnet 4.5:每次执行约 $0.01-0.03
- GPT-5.1:每次执行约 $0.01-0.025
- Gemini 2.5 Pro:每次执行约 $0.008-0.02
复杂分析与延伸思考(长输入、推理 + 输出):
- Claude Opus 4.5:每次执行约 $0.05-0.15
- o3:每次执行约 $0.04-0.12
- Gemini 3 Pro:每次执行约 $0.03-0.10
这些是粗略范围。实际成本取决于输入长度、输出长度,以及是否启用网路搜寻或延伸思考等功能。
工作流的成本
工作流会串接多个 recipes。成本是所有步骤成本的总和。以下是一个实际范例:
发票处理工作流(4 个步骤):
- 提取发票资料(Haiku 4.5):$0.003
- 检查差异(Sonnet 4.5):$0.015
- 生成核准摘要(Haiku 4.5):$0.002
- 撰写最终报告(Sonnet 4.5):$0.02
每次执行总成本:约 $0.04
每周执行 50 次(每天 10 张发票),月成本约 $8。相较之下,人工处理每张发票需要财务团队成员 15-20 分钟——每周约 12 小时的工作量。
新潜在客户管线(4 个步骤含网路搜寻):
- 潜在客户研究与网路搜寻(Sonnet 4.5):$0.04
- 潜在客户资格审查(Haiku 4.5):$0.005
- 条件检查:免费(仅逻辑,无 AI 呼叫)
- 草拟开发信(Sonnet 4.5):$0.02
每次执行总成本:约 $0.065
每月处理 200 个潜在客户,AI 成本约 $13/月。
优化杠杆:逐步骤选择模型
JieGou 最大的成本优化不是到处使用更便宜的模型——而是为每个步骤使用正确的模型。
在上述发票工作流中,提取和核准摘要使用 Haiku(快速、便宜、擅长结构化任务)。差异检查和最终报告使用 Sonnet(更好的推理、更好的文字表达)。如果所有步骤都使用 Opus,工作流每次执行成本会达到约 $0.35 而非 $0.04——在较简单步骤上品质提升微乎其微,成本却高出近 10 倍。
JieGou 让你能为每个 recipe 独立设定模型,因此你可以在步骤层级优化,而无需改变工作流结构。
执行前估算成本
JieGou 内建成本估算器,可在执行工作流前预估执行成本。估算器使用每个 recipe 过往执行的历史 token 用量来预测目前执行的成本。
对于没有历史纪录的新 recipes,估算器会根据输入和输出 schema 大小使用特定模型的预设值。
执行后追踪成本
分析仪表板会按以下方式细分 token 用量和成本:
- Recipe — 哪些 recipes 每次执行最昂贵?
- 工作流 — 每个工作流的总成本是多少?
- 部门 — 每个团队花费多少?
- 模型 — 各供应商的成本分布如何?
这种可见性让你发现优化机会。如果某个 recipe 占工作流成本的 60%,那就是实验不同模型或更短提示词的地方。
月度成本全貌
对于执行中等程度自动化的团队:
| 工作负载 | 每月执行次数 | 预估成本 |
|---|---|---|
| 销售潜在客户管线 | 200 | $13 |
| 行销内容再利用 | 20 | $1.50 |
| 客服工单分流 | 800 | $4 |
| 每周交易审查 | 4 | $0.80 |
| 发票处理 | 200 | $8 |
总计:每月约 $27 的 AI 供应商成本。 这是实际的 token 成本,直接支付给供应商。JieGou 的平台订阅费用是分开计算的,不包含 AI 加成。
将此与被取代的人工时间相比——团队每周数十小时——ROI 显而易见。
实用经验法则
- 使用能产生可接受输出的最便宜模型。 对于分流、提取和分类,Haiku 或 GPT-5-mini 通常就足够。将 Opus 和 o3 留给复杂分析和高风险内容。
- 更短的提示词成本更低。 一个简洁的提示词模板,明确告诉 AI 要做什么,比冗长且充满范例和警告的提示词便宜。
- 结构化输出 schemas 减少浪费。 当 AI 明确知道要填写哪些栏位时,会产生更短、更聚焦的输出。更少的输出 = 更低的成本。
- 网路搜寻会增加成本。 搜寻本身包含在模型定价中,但搜寻结果会增加输入上下文。只为需要最新资讯的 recipes 启用网路搜寻。