1 万美元事故后如何为 Agent 加装防护

2026-03-15·ClawFirewall·5 分钟

步骤 1：梳理每个工作流和工具调用

弄清 Agent 实际在做什么。对每个工作流，写下来：

答不出这些，相当于盲飞。

设置不可协商的、优先于 Agent 逻辑的限制：

在基础设施层、在请求到达供应商之前强制这些限制。如果只在 Agent 代码里做，bug 或循环可能绕过。

当某指标超过阈值时，熔断器触发。触发后：工作流停止。不再重试。升级给人。在有人复查前不重启。

常用触发条件：

这是阻止循环烧钱的最有效手段之一。

出问题时需要立刻知道。为以下情况配置告警：

用 Slack、邮件或短信——选你真正会看的。对于严重事件（熔断、日预算 80%），至少发给两个人短信。

每周回顾支出。哪些工作流最费钱？重试集中在哪里？能否把简单任务迁到更便宜的模型？修好一个错误路由的工作流，有时能在一夜之间砍掉 30% 支出。每周复盘能避免再次陷入浪费。

从头自建要花数月。ClawFirewall 大约五分钟就能搭好。

它插在你的 Agent 和供应商（OpenRouter、OpenClaw、OpenAI、Anthropic 等）之间，在调用发出前强制执行限制。你可以获得：

Jake 的团队在 1 万美元事故后接入了 ClawFirewall。半年后，无超支。同时平均月支出下降 62%，客服 Agent 效果还更好。

配置 ClawFirewall，几分钟内开始保护预算。