如何控制 OpenClaw 成本(上)

2026-03-20·ClawFirewall·5 分钟

如果你在用 OpenClaw 做搭建,大概也盯着月账单问过钱去哪了。不止你一个人。多数指南要么重复常识,要么深入到需要一支团队才能落地的实现细节。

这是一份实用步骤。分两部分。上篇讲量什么,以及如何优化路由和回退。

先量什么

你没法控制你没量过的东西。OpenClaw 的控制台给的是 per 模型调用数和总支出。这不够。至少要有:

  • Per 工作流成本:per 月、per 次、per 用户
  • Per 步 token 用量:以及多少是重复上下文
  • 回退量与成本:多频繁、多花多少、什么在触发
  • Per 用户/功能成本:产品哪些部分在烧钱
  • 错误与重试量:重试多少、花多少钱、什么导致的

多数团队只看到一个总月数。没有 per 工作流和 per 步数据,就是在猜。接入 OpenClaw 的实时成本工具会帮上忙。没有它,等于盲飞。

步骤 1:优化路由与回退

最快压低 OpenClaw 成本的是修好路由和回退规则。往往能省 30% 以上,只改少量代码。

按任务选对模型

团队常把一切都跑在 GPT-4o 或 Claude 3 Opus 上。复杂推理很强,但对简单任务也比小模型贵 10–20 倍。

一个地产客户在线索筛选的每一步都用 GPT-4o。3,200 美元/月。我们把 80% 的步骤迁到 GPT-4o Mini:分类、数据提取、首次回复。复杂谈判和定制推荐仍用 GPT-4o。账单降到 780 美元。转化和效果不变。

把你的工作流拆成三个档:

  • 高 stakes、复杂:GPT-4o、Claude 3 Opus
  • 中档:GPT-3.5 Turbo、Claude 3 Sonnet
  • 简单:GPT-4o Mini、Claude 3 Haiku、Llama 3 8B

大部分任务用不到最高档。OpenClaw 的路由规则可以自动把请求分到合适模型。

修好回退路由

回退是 OpenClaw 用户最大的隐性泄漏。失败调用常常路由到更贵的模型。几条原则:

  • 默认不要回退到更贵的模型。GPT-4o 失败时,用差不多的或更便宜的。
  • 限制 per 小时、per 天、per 工作流的回退量。临时限流不应变成巨额回退账单。
  • 查根因。回退量高说明有问题——修限制、错误或路由,而不是无视。

可选:自动模型路由

ClawFirewall 等工具能分析每次请求,并路由到符合要求的最便宜模型。OpenClaw 提供基础能力;全自动需要自研代码或专用工具。


下篇:Token 浪费、预算控制与持续监控 →