如何控制 OpenClaw 成本(上)
2026-03-20·ClawFirewall·5 分钟
如果你在用 OpenClaw 做搭建,大概也盯着月账单问过钱去哪了。不止你一个人。多数指南要么重复常识,要么深入到需要一支团队才能落地的实现细节。
这是一份实用步骤。分两部分。上篇讲量什么,以及如何优化路由和回退。
先量什么
你没法控制你没量过的东西。OpenClaw 的控制台给的是 per 模型调用数和总支出。这不够。至少要有:
- Per 工作流成本:per 月、per 次、per 用户
- Per 步 token 用量:以及多少是重复上下文
- 回退量与成本:多频繁、多花多少、什么在触发
- Per 用户/功能成本:产品哪些部分在烧钱
- 错误与重试量:重试多少、花多少钱、什么导致的
多数团队只看到一个总月数。没有 per 工作流和 per 步数据,就是在猜。接入 OpenClaw 的实时成本工具会帮上忙。没有它,等于盲飞。
步骤 1:优化路由与回退
最快压低 OpenClaw 成本的是修好路由和回退规则。往往能省 30% 以上,只改少量代码。
按任务选对模型
团队常把一切都跑在 GPT-4o 或 Claude 3 Opus 上。复杂推理很强,但对简单任务也比小模型贵 10–20 倍。
一个地产客户在线索筛选的每一步都用 GPT-4o。3,200 美元/月。我们把 80% 的步骤迁到 GPT-4o Mini:分类、数据提取、首次回复。复杂谈判和定制推荐仍用 GPT-4o。账单降到 780 美元。转化和效果不变。
把你的工作流拆成三个档:
- 高 stakes、复杂:GPT-4o、Claude 3 Opus
- 中档:GPT-3.5 Turbo、Claude 3 Sonnet
- 简单:GPT-4o Mini、Claude 3 Haiku、Llama 3 8B
大部分任务用不到最高档。OpenClaw 的路由规则可以自动把请求分到合适模型。
修好回退路由
回退是 OpenClaw 用户最大的隐性泄漏。失败调用常常路由到更贵的模型。几条原则:
- 默认不要回退到更贵的模型。GPT-4o 失败时,用差不多的或更便宜的。
- 限制 per 小时、per 天、per 工作流的回退量。临时限流不应变成巨额回退账单。
- 查根因。回退量高说明有问题——修限制、错误或路由,而不是无视。
可选:自动模型路由
ClawFirewall 等工具能分析每次请求,并路由到符合要求的最便宜模型。OpenClaw 提供基础能力;全自动需要自研代码或专用工具。