为什么你的 OpenClaw 正在悄悄烧钱(上)
如果你在用 OpenClaw 做模型路由,已经比大多数团队更进一步。但过去一年对数十个配置的审计显示一个模式:团队通过从未察觉的漏洞泄露 30–70% 的 OpenClaw 预算。细小、未被监控的问题,月复一月累积。
很多团队以为已经覆盖到位。基础路由规则、简单任务用便宜模型、速率限制。这些都挡不住真正的泄漏——悄悄溜过的隐性、冗余调用。
漏洞 #1:未优化的回退路由
回退路由是 OpenClaw 的强项。主模型挂了或限流?切换到备用。工作流保持运行。
这也是大多数团队不必要支出的最大来源。
典型配置:GPT-4o 失败就回退到 Claude 3 Opus。两者都是强模型,工作流能继续。问题是:Claude 3 Opus 单 token 往往贵 20–30%。当主模型频繁触发限制或报错时,OpenClaw 会默默把这些调用送到更贵的选项。你看到的是账单,不是路由。
一个 15 人电商团队用 OpenClaw 跑商品推荐——GPT-4o 主、Claude 3 Opus 回退。他们预期约 2,000 美元/月。日志显示 62% 的调用去了 Claude,因为 GPT-4o 限流在高峰下太低。实际支出:4,800 美元/月。持续六个月。
他们的控制台只显示总调用数,没有回退量和成本。他们以为账单正常。
多数团队设好回退就再也没动过。没有监控、没有按成本选回退模型、没有回退量上限。结果:每月数千美元隐性支出。
漏洞 #2:冗余 Prompt 链
OpenClaw 可以方便地在模型间链式调用 prompt——用便宜模型分类、用更强模型生成、第三个做事实核查。有用。也容易链得过长。
很多团队沿用原型时的结构:分类请求 → 提取数据 → 生成 → 合规检查 → 格式化。每一步都是单独 API 调用。每一步都在付 token。而且每传到下一步,你都在重复发送上下文。10 步链可能把同一 1,000 token 发十遍。
一家金融科技团队有 7 步 onboarding 链。平均每用户 3,200 token。把五步合并成一步后降到 1,100 token——结果和合规不变。月费从 7,500 美元降到 2,500 美元。
大多数人从不回顾链条。没有 per 步 token 统计、没有查找冗余上下文、没有测试合并步骤。他们为同样结果多付 2–3 倍。