为什么你的 OpenClaw 正在悄悄烧钱（上）

2026-03-20·ClawFirewall·4 分钟

如果你在用 OpenClaw 做模型路由，已经比大多数团队更进一步。但过去一年对数十个配置的审计显示一个模式：团队通过从未察觉的漏洞泄露 30–70% 的 OpenClaw 预算。细小、未被监控的问题，月复一月累积。

很多团队以为已经覆盖到位。基础路由规则、简单任务用便宜模型、速率限制。这些都挡不住真正的泄漏——悄悄溜过的隐性、冗余调用。

漏洞 #1：未优化的回退路由

回退路由是 OpenClaw 的强项。主模型挂了或限流？切换到备用。工作流保持运行。

这也是大多数团队不必要支出的最大来源。

典型配置：GPT-4o 失败就回退到 Claude 3 Opus。两者都是强模型，工作流能继续。问题是：Claude 3 Opus 单 token 往往贵 20–30%。当主模型频繁触发限制或报错时，OpenClaw 会默默把这些调用送到更贵的选项。你看到的是账单，不是路由。

一个 15 人电商团队用 OpenClaw 跑商品推荐——GPT-4o 主、Claude 3 Opus 回退。他们预期约 2,000 美元/月。日志显示 62% 的调用去了 Claude，因为 GPT-4o 限流在高峰下太低。实际支出：4,800 美元/月。持续六个月。

他们的控制台只显示总调用数，没有回退量和成本。他们以为账单正常。

多数团队设好回退就再也没动过。没有监控、没有按成本选回退模型、没有回退量上限。结果：每月数千美元隐性支出。

OpenClaw 可以方便地在模型间链式调用 prompt——用便宜模型分类、用更强模型生成、第三个做事实核查。有用。也容易链得过长。

很多团队沿用原型时的结构：分类请求 → 提取数据 → 生成 → 合规检查 → 格式化。每一步都是单独 API 调用。每一步都在付 token。而且每传到下一步，你都在重复发送上下文。10 步链可能把同一 1,000 token 发十遍。

一家金融科技团队有 7 步 onboarding 链。平均每用户 3,200 token。把五步合并成一步后降到 1,100 token——结果和合规不变。月费从 7,500 美元降到 2,500 美元。

大多数人从不回顾链条。没有 per 步 token 统计、没有查找冗余上下文、没有测试合并步骤。他们为同样结果多付 2–3 倍。