Ce que coûte réellement l'exécution de workflows IA (avec de vrais chiffres)

« Combien cela va-t-il coûter ? » est la question la plus difficile à laquelle répondre concernant l’automatisation IA. La tarification des tokens est par million, les modèles facturent différemment les entrées et les sorties, et le coût d’une seule exécution dépend de la quantité de texte qui entre et qui sort. La plupart des équipes ignorent les coûts jusqu’à l’arrivée de la facture ou sur-optimisent en utilisant le modèle le moins cher pour tout.

Aucune des deux approches ne fonctionne. Voici comment penser les coûts de workflows IA de manière pratique.

Les bases : ce que coûte l’exécution d’une seule Recipe

L’exécution d’une Recipe a deux composantes de coût : les tokens d’entrée (votre prompt + contexte) et les tokens de sortie (la réponse de l’IA). Les tokens de sortie sont généralement 3 à 5 fois plus chers que les tokens d’entrée.

Voici ce que coûtent les exécutions typiques de Recipes selon les fournisseurs (approximatif, début 2026) :

Extraction ou classification simple (entrée courte, sortie structurée) :

Claude Haiku 4.5 : ~0,002-0,005 $ par exécution
GPT-5-mini : ~0,002-0,004 $ par exécution
Gemini 2.5 Flash Lite : ~0,001-0,003 $ par exécution

Génération de contenu (entrée modérée, sortie plus longue) :

Claude Sonnet 4.5 : ~0,01-0,03 $ par exécution
GPT-5.1 : ~0,01-0,025 $ par exécution
Gemini 2.5 Pro : ~0,008-0,02 $ par exécution

Analyse complexe avec réflexion étendue (entrée longue, raisonnement + sortie) :

Claude Opus 4.5 : ~0,05-0,15 $ par exécution
o3 : ~0,04-0,12 $ par exécution
Gemini 3 Pro : ~0,03-0,10 $ par exécution

Ce sont des fourchettes approximatives. Les coûts réels dépendent de la longueur des entrées, de la longueur des sorties, et de l’activation ou non de fonctionnalités comme la recherche web ou la réflexion étendue.

Ce que coûte un workflow

Un workflow enchaîne plusieurs Recipes. Le coût est la somme de tous les coûts d’étapes. Voici un exemple réaliste :

Workflow de traitement de factures (4 étapes) :

Extraire les données de facture (Haiku 4.5) : 0,003 $
Vérifier les écarts (Sonnet 4.5) : 0,015 $
Générer le résumé d’approbation (Haiku 4.5) : 0,002 $
Rédiger le rapport final (Sonnet 4.5) : 0,02 $

Total par exécution : ~0,04 $

Exécutez cela 50 fois par semaine (10 factures par jour), et le coût mensuel est d’environ 8 $. Pour contexte, le processus manuel prend à un membre de l’équipe finance 15-20 minutes par facture — soit environ 12 heures de travail par semaine.

Pipeline nouveau prospect (4 étapes avec recherche web) :

Recherche de prospect avec recherche web (Sonnet 4.5) : 0,04 $
Qualification du prospect (Haiku 4.5) : 0,005 $
Vérification conditionnelle : gratuit (logique seule, pas d’appel IA)
Brouillon de prise de contact (Sonnet 4.5) : 0,02 $

Total par exécution : ~0,065 $

À 200 prospects par mois, cela représente environ 13 $/mois en coûts IA.

Le levier d’optimisation : sélection de modèle par étape

La plus grande optimisation de coûts dans JieGou n’est pas d’utiliser des modèles moins chers partout — c’est d’utiliser le bon modèle pour chaque étape.

Dans le workflow de factures ci-dessus, l’extraction et le résumé d’approbation utilisent Haiku (rapide, peu coûteux, performant sur les tâches structurées). La vérification des écarts et le rapport final utilisent Sonnet (meilleur raisonnement, meilleure prose). Si vous utilisiez Opus pour tout, le workflow coûterait ~0,35 $ par exécution au lieu de 0,04 $ — près de 10 fois plus pour une amélioration marginale de qualité sur les étapes plus simples.

JieGou vous permet de définir le modèle indépendamment pour chaque Recipe, ce qui vous permet d’optimiser au niveau de l’étape sans changer la structure du workflow.

Estimer les coûts avant d’exécuter

JieGou inclut un estimateur de coûts qui projette le coût d’une exécution de workflow avant que vous ne l’exécutiez. L’estimateur utilise l’utilisation historique de tokens des exécutions précédentes de chaque Recipe pour prédire les coûts de l’exécution actuelle.

Pour les nouvelles Recipes sans historique, l’estimateur utilise des valeurs par défaut spécifiques au modèle basées sur les tailles de schéma d’entrée et de sortie.

Suivre les coûts après l’exécution

Le tableau de bord analytics ventile l’utilisation de tokens et les coûts par :

Recipe — Quelles Recipes sont les plus coûteuses par exécution ?
Workflow — Quel est le coût total de chaque workflow ?
Département — Combien chaque équipe dépense-t-elle ?
Modèle — Quelle est la répartition des coûts entre les fournisseurs ?

Cette visibilité vous permet de repérer les opportunités d’optimisation. Si une Recipe représente 60 % du coût d’un workflow, c’est là qu’il faut expérimenter avec un modèle différent ou un prompt plus court.

Le tableau des coûts mensuels

Pour une équipe avec une automatisation modérée :

Charge de travail	Exécutions mensuelles	Coût estimé
Pipeline de prospects commerciaux	200	13 $
Réutilisation de contenu marketing	20	1,50 $
Triage de tickets support	800	4 $
Revue hebdomadaire des deals	4	0,80 $
Traitement de factures	200	8 $

Total : ~27 $/mois en coûts de fournisseur IA. C’est le coût réel en tokens, payé directement aux fournisseurs. L’abonnement plateforme JieGou est séparé et n’inclut pas de marge sur l’IA.

Comparez cela au temps manuel remplacé — des dizaines d’heures par semaine à travers l’équipe — et le ROI est difficile à contester.

Règles générales

Utilisez le modèle le moins cher qui produit une sortie acceptable. Pour le triage, l’extraction et la classification, Haiku ou GPT-5-mini est généralement suffisant. Réservez Opus et o3 pour l’analyse complexe et le contenu à enjeux élevés.
Des prompts plus courts coûtent moins. Un template de prompt concis qui dit exactement à l’IA quoi faire coûte moins qu’un long prompt rembourré d’exemples et de mises en garde.
Les schémas de sortie structurée réduisent le gaspillage. Quand l’IA sait exactement quels champs remplir, elle produit une sortie plus courte et plus ciblée. Moins de sortie = coût inférieur.
La recherche web ajoute du coût. La recherche elle-même est incluse dans la tarification du modèle, mais les résultats de recherche s’ajoutent au contexte d’entrée. N’activez la recherche web que pour les Recipes qui ont besoin d’informations actuelles.