1 万美元事故后如何为 Agent 加装防护

2026-03-15·ClawFirewall·5 分钟

上篇:发生了什么、为何 Agent 更难控制 ←

步骤 1:梳理每个工作流和工具调用

弄清 Agent 实际在做什么。对每个工作流,写下来:

  • 单次运行平均 API 调用次数
  • 最坏情况下的调用次数
  • 工具失败时会发生什么——会重试多少次?
  • 是否会启动嵌套 Agent?
  • 单次运行最大可能成本?

答不出这些,相当于盲飞。

步骤 2:在每一层设硬性限制

设置不可协商的、优先于 Agent 逻辑的限制:

  • 单次工具调用重试:最多 3 次
  • 单工作流重试:最多 2 次
  • 单 Agent 每分钟 API 调用
  • 单工作流每小时 API 调用
  • 单用户请求 token 数
  • 单 Agent 每日支出
  • 团队每月支出

在基础设施层、在请求到达供应商之前强制这些限制。如果只在 Agent 代码里做,bug 或循环可能绕过。

步骤 3:每个工作流配熔断器

当某指标超过阈值时,熔断器触发。触发后:工作流停止。不再重试。升级给人。在有人复查前不重启。

常用触发条件:

  • 失败重试超过 3 次
  • 单次运行 token 为平均的 2 倍
  • 单次运行成本为平均的 10 倍
  • 每分钟 API 调用为平均的 5 倍

这是阻止循环烧钱的最有效手段之一。

步骤 4:实时告警与异常检测

出问题时需要立刻知道。为以下情况配置告警:

  • 单 Agent 日预算达到 50%
  • API 调用量异常
  • 熔断器触发
  • 错误率超过 5%

用 Slack、邮件或短信——选你真正会看的。对于严重事件(熔断、日预算 80%),至少发给两个人短信。

步骤 5:每周审计

每周回顾支出。哪些工作流最费钱?重试集中在哪里?能否把简单任务迁到更便宜的模型?修好一个错误路由的工作流,有时能在一夜之间砍掉 30% 支出。每周复盘能避免再次陷入浪费。

更快的方式:ClawFirewall

从头自建要花数月。ClawFirewall 大约五分钟就能搭好。

它插在你的 Agent 和供应商(OpenRouter、OpenClaw、OpenAI、Anthropic 等)之间,在调用发出前强制执行限制。你可以获得:

  • Per Agent、per 工作流、per 用户的预算限制
  • 预置熔断器
  • 实时异常检测与告警
  • 跨供应商的统一调用与费用视图

Jake 的团队在 1 万美元事故后接入了 ClawFirewall。半年后,无超支。同时平均月支出下降 62%,客服 Agent 效果还更好。

配置 ClawFirewall,几分钟内开始保护预算。