Come rendere i tuoi agenti a prova di proiettile dopo un picco da 10k$
Parte 1: Cosa è successo e perché gli agenti sono più difficili da controllare ←
Passo 1: Mappa ogni workflow e chiamata a strumento
Sai esattamente cosa fanno i tuoi agenti. Per ogni workflow, annota:
- Chiamate API medie per esecuzione
- Chiamate worst-case per esecuzione
- Cosa succede quando uno strumento fallisce—quanti retry?
- Può avviare agenti annidati?
- Costo massimo possibile per esecuzione?
Se non sai rispondere, voli alla cieca.
Passo 2: Limiti rigidi a ogni livello
Imposta limiti non negoziabili che sovrascrivono la logica dell'agente:
- Retry per chiamata a strumento: max 3
- Retry per workflow: max 2 totali
- Chiamate API per minuto per agente
- Chiamate API per ora per workflow
- Token per richiesta utente
- Spend per giorno per agente
- Spend per mese per team
Applica questi a livello infrastrutturale, prima che le chiamate arrivino al fornitore. Se sono solo nel codice dell'agente, un bug o un loop possono bypassarli.
Passo 3: Circuit breaker per ogni workflow
Un breaker scatta quando qualcosa supera una soglia. Quando scatta, il workflow si ferma. Niente più retry. Escalation a umano. Non riavviare finché qualcuno non ha verificato.
Condizioni di scatto che funzionano:
- Più di 3 retry falliti
- 2x token medi per una singola esecuzione
- 10x costo medio per una singola esecuzione
- 5x chiamate API medie per minuto
Questo è uno dei modi più efficaci per fermare un loop prima che bruci il budget.
Passo 4: Alert e rilevazione anomalie in tempo reale
Devi sapere quando qualcosa va storto. Imposta alert per:
- Spend al 50% del budget giornaliero per agente
- Volume anomalo di chiamate API
- Scatti di circuit breaker
- Tasso di errore oltre il 5%
Usa Slack, email o SMS—qualunque cosa controlli davvero. Per eventi critici (scatto breaker, 80% del budget giornaliero), invia SMS ad almeno due persone.
Passo 5: Audit settimanali
Rivedi lo spend ogni settimana. Quali workflow costano di più? Dove sono i retry? Puoi spostare task semplici su modelli più economici? Sistemare un workflow mal indirizzato può tagliare lo spend del 30% da un giorno all'altro. Le revisioni settimanali ti impediscono di tornare allo spreco.
Una via più veloce: ClawFirewall
Costruire tutto da zero richiede mesi. ClawFirewall lo fa in circa cinque minuti.
Si posiziona tra i tuoi agenti e i fornitori (OpenRouter, OpenClaw, OpenAI, Anthropic, ecc.) e applica i limiti prima che le chiamate escano. Otterrai:
- Limiti di budget per agente, per workflow, per utente
- Circuit breaker predefiniti
- Rilevazione anomalie e alert in tempo reale
- Una vista unificata di ogni chiamata e centesimo su tutti i fornitori
Il team di Jake ha aggiunto ClawFirewall dopo l'incidente da 10k$. Sei mesi dopo, nessun superamento. Hanno anche ridotto lo spend mensile medio del 62% migliorando l'agente di supporto.
Configura ClawFirewall in pochi minuti e inizia a proteggere il tuo budget.