1 万美元事故后如何为 Agent 加装防护
2026-03-15·ClawFirewall·5 分钟
步骤 1:梳理每个工作流和工具调用
弄清 Agent 实际在做什么。对每个工作流,写下来:
- 单次运行平均 API 调用次数
- 最坏情况下的调用次数
- 工具失败时会发生什么——会重试多少次?
- 是否会启动嵌套 Agent?
- 单次运行最大可能成本?
答不出这些,相当于盲飞。
步骤 2:在每一层设硬性限制
设置不可协商的、优先于 Agent 逻辑的限制:
- 单次工具调用重试:最多 3 次
- 单工作流重试:最多 2 次
- 单 Agent 每分钟 API 调用
- 单工作流每小时 API 调用
- 单用户请求 token 数
- 单 Agent 每日支出
- 团队每月支出
在基础设施层、在请求到达供应商之前强制这些限制。如果只在 Agent 代码里做,bug 或循环可能绕过。
步骤 3:每个工作流配熔断器
当某指标超过阈值时,熔断器触发。触发后:工作流停止。不再重试。升级给人。在有人复查前不重启。
常用触发条件:
- 失败重试超过 3 次
- 单次运行 token 为平均的 2 倍
- 单次运行成本为平均的 10 倍
- 每分钟 API 调用为平均的 5 倍
这是阻止循环烧钱的最有效手段之一。
步骤 4:实时告警与异常检测
出问题时需要立刻知道。为以下情况配置告警:
- 单 Agent 日预算达到 50%
- API 调用量异常
- 熔断器触发
- 错误率超过 5%
用 Slack、邮件或短信——选你真正会看的。对于严重事件(熔断、日预算 80%),至少发给两个人短信。
步骤 5:每周审计
每周回顾支出。哪些工作流最费钱?重试集中在哪里?能否把简单任务迁到更便宜的模型?修好一个错误路由的工作流,有时能在一夜之间砍掉 30% 支出。每周复盘能避免再次陷入浪费。
更快的方式:ClawFirewall
从头自建要花数月。ClawFirewall 大约五分钟就能搭好。
它插在你的 Agent 和供应商(OpenRouter、OpenClaw、OpenAI、Anthropic 等)之间,在调用发出前强制执行限制。你可以获得:
- Per Agent、per 工作流、per 用户的预算限制
- 预置熔断器
- 实时异常检测与告警
- 跨供应商的统一调用与费用视图
Jake 的团队在 1 万美元事故后接入了 ClawFirewall。半年后,无超支。同时平均月支出下降 62%,客服 Agent 效果还更好。
配置 ClawFirewall,几分钟内开始保护预算。