如何控制 OpenClaw 成本(下)
2026-03-20·ClawFirewall·5 分钟
步骤 2:削减 token 浪费
多数团队在冗余上下文、过长 prompt 和不必要的链式调用上浪费 40–60% 的 token。
精简 prompt
每个词都要有用。冗余说明、冗长示例、多余上下文增加成本却不改善输出。说一遍就够了。用 1–2 个示例而不是一堆。只传模型当前步骤需要的上下文。团队常能把 prompt token 砍 50%+ 且不损失质量。
减少 prompt 链
链上每一步都会重新发送上下文。5 步链可能为同一 1,000 token 付五次费。能合并的步骤就合并。必须分开的,只传下一步需要的 minimal 输出,不要整段对话。
设 per 请求最大 token 限制
默认限制往往是 4096+。分类用 5。短回复用 500。限制输出长度,别为用不到的 token 付费。
步骤 3:预算控制
就算路由和 prompt 都调好了,还是需要护栏。一个坏工作流或重度用户几天就能烧光月预算。
OpenClaw 给的是速率限制和单一月限额。要真正保护自己:
- Per 工作流限额:日、周、月。工作流触顶就暂停
- Per 用户和 per 功能限额:防止一个重度用户或内部工具掏空面向客户的预算
- Per 模型上限:尤其是贵模型,避免回退堆出大账单
- 硬性重试限制:per 调用、per 工作流。止住 runaway 重试
- 熔断器:工作流触及错误/支出阈值时暂停
ClawFirewall 内置这些,并在请求到达 OpenClaw 前强制执行,避免 surprise 账单。
步骤 4:持续监控
成本控制不是一次性任务。新工作流、新用户、新模型会改变局面。要保持掌控:
- 实时看板:不要等到月账单
- 每周工作流回顾:哪些任务可以迁到便宜模型?token 浪费在哪?哪些工作流回退在飙升?
- 定期模型测试:新模型常有更好的性价比。合适时更新路由
- 每月用户/功能回顾:产品的哪块在烧钱?值不值?
ClawFirewall 的看板用告警和周报把这些展现出来,让你知道该砍哪里。
小结
有了可观测、路由、精简 prompt 和预算控制,通常能把 OpenClaw 支出砍 50% 以上而不牺牲可靠性。
错在拖延。不少团队几个月多花钱,觉得优化太费事。ClawFirewall 几分钟就能把这些策略落地。试试 ClawFirewall.ai。