Contrôler les coûts OpenClaw (Partie 1)

2026-03-20·ClawFirewall·5 minutes

Si vous construisez sur OpenClaw, vous avez probablement déjà regardé une facture mensuelle en vous demandant où part l’argent. Vous n’êtes pas seul. La plupart des guides répètent des conseils évidents ou entrent dans des détails d’implémentation qui demandent une équipe.

Voici un parcours pratique. En deux parties. La partie 1 couvre quoi mesurer et comment corriger le routage et les secours.

Quoi mesurer en premier

On ne contrôle pas ce qu’on ne mesure pas. Le tableau de bord OpenClaw donne le nombre d’appels par modèle et les dépenses totales. Ce n’est pas suffisant. Il vous faut au minimum :

  • Coût par workflow – par mois, par exécution, par utilisateur
  • Usage de tokens par étape – et combien de contexte répété
  • Volume et coût des secours – à quelle fréquence, combien en plus, qu’est-ce qui les déclenche
  • Coût par utilisateur/fonctionnalité – quelles parties du produit tirent les dépenses
  • Volume d’erreurs et de retentatives – combien de retentatives, ce qu’elles coûtent, pourquoi

La plupart des équipes ne voient qu’un chiffre mensuel. Sans données par workflow et par étape, vous devinez. Un outil de coûts temps réel qui s’intègre à OpenClaw aide. Sans ça, vous pilotez à l’aveugle.

Étape 1 : Optimiser le routage et les secours

Le moyen le plus rapide de réduire les coûts OpenClaw est de corriger les règles de routage et de secours. Souvent 30 % ou plus, avec peu de changements de code.

Le bon modèle pour la tâche

Les équipes font souvent tourner tout sur GPT-4o ou Claude 3 Opus. Ces modèles sont excellents pour le raisonnement complexe. Ils sont aussi 10 à 20x plus chers que les modèles plus petits pour les tâches simples.

Un client immobilier utilisait GPT-4o à chaque étape de qualification de leads. 3 200 $/mois. Nous avons déplacé 80 % des étapes vers GPT-4o Mini : classification, extraction de données, premières réponses. GPT-4o est resté pour la négociation complexe et les recommandations sur mesure. La facture est tombée à 780 $. Même conversion, même qualité.

Divisez vos workflows en trois niveaux :

  • Enjeux élevés, complexe – GPT-4o, Claude 3 Opus
  • Niveau intermédiaire – GPT-3.5 Turbo, Claude 3 Sonnet
  • Simple – GPT-4o Mini, Claude 3 Haiku, Llama 3 8B

La plupart des tâches n’ont pas besoin du niveau supérieur. Les règles de routage OpenClaw peuvent envoyer chaque requête au bon modèle automatiquement.

Corriger le routage de secours

Le secours est la plus grosse fuite cachée pour les utilisateurs OpenClaw. Les appels en échec routent souvent vers des modèles plus chers. Quelques règles :

  • Ne pas basculer par défaut vers un modèle plus cher. Si GPT-4o échoue, utiliser un équivalent ou moins cher.
  • Plafonner le volume de secours par heure, jour et workflow. Une limite temporaire ne doit pas devenir une grosse facture de secours.
  • Investiguer la cause racine. Un volume de secours élevé indique un problème—corriger les limites, erreurs ou routage au lieu d’ignorer.

Optionnel : routage automatique des modèles

Des outils comme ClawFirewall peuvent analyser chaque requête et router vers le modèle le moins cher qui convient. OpenClaw fournit les briques ; une automatisation complète demande du code custom ou un outil dédié.


Partie 2 : Gaspillage de tokens, budget et surveillance continue →