L’Operations Hub de JieGou a commencé comme un endroit pour voir ce que faisaient vos automatisations IA — quels départements étaient actifs, qui avait la permission de faire quoi, combien d’exécutions avaient lieu. Utile, mais incomplet. Si vous gérez un business sur JieGou, vous devez voir plus que les métriques d’automatisation.
Aujourd’hui nous étendons l’Operations Hub avec l’analytique de revenus, le monitoring de disponibilité, la santé de la facturation, le suivi d’adoption utilisateur, le monitoring de sécurité et un tableau de bord de file d’attente de lettres mortes. C’est un centre d’opérations SaaS complet.
Analytique de revenus
Le tableau de bord de revenus tire des données en direct de Stripe pour montrer les chiffres qui comptent :
MRR et ARR — Calculés à partir des abonnements actifs, normalisés pour les plans annuels. Vous voyez le MRR total, une ventilation par niveau de plan et des données de tendance. L’ARPU est calculé automatiquement à partir du nombre de comptes payants.
Churn et rétention — Taux de churn en logo (comptes perdus), taux de churn en revenu (MRR perdu) et rétention nette de revenu (NRR). La NRR tient compte du revenu d’expansion des mises à niveau et de la contraction des rétrogradations, vous donnant le tableau complet de la croissance ou diminution des clients existants. L’expansion et la contraction sont suivies via les événements de mise à jour d’abonnement Stripe avec comparaison previous_attributes, chaque changement de plan est donc capturé.
Économie unitaire — Vue par compte du MRR versus le coût (utilisation de tokens). JieGou calcule le pourcentage de marge pour chaque compte, vous permettant d’identifier quels clients sont rentables et lesquels consomment plus qu’ils ne paient. Les coûts sont suivis à partir des enregistrements d’utilisation et agrégés mensuellement.
Les snapshots de revenus sont stockés quotidiennement, permettant la comparaison période sur période et le calcul précis du churn contre une base de départ connue.
Santé de la facturation
Le revenu semble sain en agrégé, mais les problèmes de facturation individuels peuvent se cacher dans le bruit. Le tableau de bord de santé de facturation les fait remonter :
- Paiements échoués — Charges qui ont échoué dans les 30 derniers jours, avec raison d’échec et montant à risque
- Abonnements en retard — Comptes avec des paiements en souffrance nécessitant une attention de relance
- Remboursements récents — Remboursements émis dans les 30 derniers jours avec codes de raison
- Renouvellements à venir — Abonnements renouvelant dans les 7 prochains jours, pour traiter proactivement tout problème
- Réconciliation de revenus — MRR attendu versus revenu réellement collecté (y compris les charges de dépassement), avec un pourcentage d’écart
Adoption utilisateur
Savoir qui paie est une chose. Savoir qui utilise réellement le produit en est une autre.
Utilisateurs actifs — DAU, WAU et MAU suivis via Redis HyperLogLog. HyperLogLog donne des estimations de cardinalité avec moins de 2 % de marge d’erreur tout en utilisant un minimum de mémoire — pas besoin de stocker les ID utilisateur individuels. Le ratio DAU/MAU vous indique en un coup d’œil la rétention du produit.
Adoption de fonctionnalités — Dix fonctionnalités clés sont suivies individuellement : chat, agent, workflows, planifications, déclencheurs, bakeoffs, exécutions par lots, documents, voix de marque et outils MCP. Pour chaque fonctionnalité, vous voyez les comptes uniques l’utilisant et le nombre total d’utilisations, plus un taux d’adoption par rapport au total des comptes payants.
Entonnoir d’activation — Sept jalons du premier login au power user : choisir un département, exécuter la première tâche IA, donner un feedback, planifier une tâche, inviter un coéquipier, créer un workflow, voir la tendance qualité. Le taux de conversion à chaque étape montre où les utilisateurs se bloquent.
Un graphique de tendance DAU sur 30 jours complète le tableau, montrant les comptages d’utilisateurs actifs quotidiens sur le dernier mois.
Disponibilité et monitoring SLA
Le temps de disponibilité n’est pas optionnel. Le système de monitoring de disponibilité enregistre les vérifications de santé à la résolution de la minute, suivant le statut des composants Firestore et Redis.
Calcul du temps de disponibilité — Pourcentage de temps de disponibilité du mois en cours et sur 30 jours glissants, mesuré contre un objectif SLA de 99,9 %. Un indicateur de statut passe au vert (>= 99,9 %), jaune (>= 99,5 %) ou rouge (< 99,5 %). Le budget d’erreur restant montre combien de minutes de dégradation vous pouvez absorber avant de violer le SLA.
Détection automatique d’incidents — Trois échecs consécutifs de vérification de santé créent automatiquement un enregistrement d’incident. Les incidents sont catégorisés par sévérité (mineur, majeur, critique) selon le nombre de composants affectés. Quand la santé revient à la normale, l’incident se résout automatiquement.
Métriques d’incidents — MTTR (temps moyen de résolution) et MTBF (temps moyen entre pannes) sur une fenêtre de 90 jours. Ce sont les chiffres que les auditeurs et acheteurs enterprise demandent.
API de statut public — Un endpoint public à /api/health renvoie le statut actuel avec une ventilation par composant. Aucune authentification requise. Renvoie HTTP 200 quand sain, 503 quand dégradé.
Monitoring de sécurité
Les incidents de sécurité ne s’annoncent pas. La couche de monitoring de sécurité surveille les anomalies en continu :
Détection de force brute — Suivi des échecs d’authentification par IP avec une fenêtre glissante de 5 minutes. Plus de 10 échecs en 5 minutes déclenche un blocage automatique d’IP. Les IP uniques en échec et les comptages d’échecs sur 24 heures sont visibles en un coup d’œil.
Santé des clés API — L’âge de chaque clé API, son statut de validité et le timestamp de dernière validation. Les clés de plus de 90 jours déclenchent des alertes de rotation. Vous ne devriez pas avoir à vous souvenir de quand vous avez fait la dernière rotation — le tableau de bord vous le dit.
Détection de pics d’utilisation — Une vérification quotidienne compare l’utilisation de chaque compte à sa moyenne glissante sur 7 jours. L’utilisation dépassant 3x la moyenne génère une alerte, catégorisée par sévérité : basse (3-5x), moyenne (5-10x), élevée (>10x). Cela détecte les clés compromises, les automatisations emballées et les patterns d’utilisation inattendus.
Audit des changements de rôle — Tous les changements de rôle des 7 derniers jours, montrant qui a changé qui et quels étaient les anciens et nouveaux rôles. L’escalade de permissions est le vecteur le plus courant pour les menaces internes — la visibilité est la défense.
Les alertes sont rejetables par le personnel et suivies avec des métadonnées d’audit (qui a rejeté, quand).
Tableau de bord de la file d’attente de lettres mortes
Les opérations asynchrones échouent. Les webhooks ne sont pas délivrés. Les emails rebondissent. Les exécutions planifiées expirent. Le tableau de bord DLQ montre tout en un seul endroit.
JieGou suit 15 catégories d’opérations asynchrones : livraison de webhooks, email, logs d’audit, notifications, enregistrements d’utilisation, charges de dépassement, exécutions planifiées, exécutions de déclencheurs, destinations de sortie, synchronisations de connecteurs, digests d’insights, exécutions par lots, exécutions de pipeline et notifications Slack.
Pour chaque catégorie, vous voyez les comptages en attente, en réessai et épuisés, plus un taux de succès de réessai et l’âge de l’entrée en attente la plus ancienne. Les opérations échouées sont réessayées automatiquement avec un backoff exponentiel — 1 minute, 5 minutes, 15 minutes — jusqu’à 3 tentatives avant d’être marquées comme épuisées.
Ce n’est pas juste un log d’erreurs. C’est un tableau de bord opérationnel qui vous dit quels sous-systèmes nécessitent une attention et si le mécanisme de réessai récupère réellement des échecs.
Tout en un seul endroit
L’Operations Hub étendu rassemble six vues que les équipes dispersent habituellement sur plusieurs outils :
- Paysage d’automatisation — Santé au niveau département, dépendances inter-départements
- Gouvernance — Permissions utilisateur, historique des changements, niveaux de conformité
- Revenus & facturation — MRR, churn, santé de facturation, réconciliation
- Adoption — DAU/WAU/MAU, utilisation des fonctionnalités, entonnoir d’activation
- Disponibilité — Temps de disponibilité, conformité SLA, historique des incidents
- Sécurité — Détection de force brute, santé des clés, anomalies d’utilisation
Pas de tableaux de bord Grafana à maintenir. Pas d’onglets Stripe à jongler. Pas d’outils de monitoring de sécurité séparés. Une console, une connexion, un ensemble d’alertes.
Disponibilité
Les vues paysage d’automatisation, gouvernance et analytique d’organisation sont disponibles sur tous les plans. L’analytique de revenus, le monitoring de disponibilité et le monitoring de sécurité sont disponibles sur les plans Team et Enterprise. En savoir plus sur l’Operations Hub ou commencez votre essai gratuit.