如何控制 OpenClaw 成本(下)

2026-03-20·ClawFirewall·5 分钟

上篇:可观测与路由 ←

步骤 2:削减 token 浪费

多数团队在冗余上下文、过长 prompt 和不必要的链式调用上浪费 40–60% 的 token。

精简 prompt

每个词都要有用。冗余说明、冗长示例、多余上下文增加成本却不改善输出。说一遍就够了。用 1–2 个示例而不是一堆。只传模型当前步骤需要的上下文。团队常能把 prompt token 砍 50%+ 且不损失质量。

减少 prompt 链

链上每一步都会重新发送上下文。5 步链可能为同一 1,000 token 付五次费。能合并的步骤就合并。必须分开的,只传下一步需要的 minimal 输出,不要整段对话。

设 per 请求最大 token 限制

默认限制往往是 4096+。分类用 5。短回复用 500。限制输出长度,别为用不到的 token 付费。

步骤 3:预算控制

就算路由和 prompt 都调好了,还是需要护栏。一个坏工作流或重度用户几天就能烧光月预算。

OpenClaw 给的是速率限制和单一月限额。要真正保护自己:

  • Per 工作流限额:日、周、月。工作流触顶就暂停
  • Per 用户和 per 功能限额:防止一个重度用户或内部工具掏空面向客户的预算
  • Per 模型上限:尤其是贵模型,避免回退堆出大账单
  • 硬性重试限制:per 调用、per 工作流。止住 runaway 重试
  • 熔断器:工作流触及错误/支出阈值时暂停

ClawFirewall 内置这些,并在请求到达 OpenClaw 前强制执行,避免 surprise 账单。

步骤 4:持续监控

成本控制不是一次性任务。新工作流、新用户、新模型会改变局面。要保持掌控:

  • 实时看板:不要等到月账单
  • 每周工作流回顾:哪些任务可以迁到便宜模型?token 浪费在哪?哪些工作流回退在飙升?
  • 定期模型测试:新模型常有更好的性价比。合适时更新路由
  • 每月用户/功能回顾:产品的哪块在烧钱?值不值?

ClawFirewall 的看板用告警和周报把这些展现出来,让你知道该砍哪里。

小结

有了可观测、路由、精简 prompt 和预算控制,通常能把 OpenClaw 支出砍 50% 以上而不牺牲可靠性。

错在拖延。不少团队几个月多花钱,觉得优化太费事。ClawFirewall 几分钟就能把这些策略落地。试试 ClawFirewall.ai