Operations Hub: monitoreo de ingresos, disponibilidad y seguridad en un solo panel

El Operations Hub de JieGou ahora rastrea MRR/ARR, salud de facturación, adopción de usuarios, cumplimiento de SLA y amenazas de seguridad — todo lo que necesita para operar un negocio SaaS, junto con sus métricas de automatización de IA.

JieGou Team · 23 de febrero de 2026 · 6 min de lectura

El Operations Hub de JieGou comenzó como un lugar para ver lo que sus automatizaciones de IA estaban haciendo — qué departamentos estaban activos, quién tenía permiso para hacer qué, cuántas ejecuciones estaban ocurriendo. Útil, pero incompleto. Si está ejecutando un negocio en JieGou, necesita ver más que métricas de automatización.

Hoy estamos expandiendo el Operations Hub con analíticas de ingresos, monitoreo de disponibilidad, salud de facturación, rastreo de adopción de usuarios, monitoreo de seguridad y un panel de cola de mensajes no entregados. Es un centro de operaciones SaaS completo.

Analíticas de ingresos

El panel de ingresos obtiene datos en vivo de Stripe para mostrar los números que importan:

MRR y ARR — Calculados a partir de suscripciones activas, normalizados para planes anuales. Usted ve el MRR total, un desglose por nivel de plan y datos de tendencia. El ARPU se calcula automáticamente a partir del conteo de cuentas que pagan.

Churn y retención — Tasa de churn de logos (cuentas perdidas), tasa de churn de ingresos (MRR perdido) y Retención Neta de Ingresos (NRR). NRR cuenta el ingreso de expansión por upgrades y la contracción por downgrades, dándole el panorama completo de si los clientes existentes están creciendo o reduciéndose. La expansión y contracción se rastrean vía eventos de actualización de suscripción de Stripe con comparación de previous_attributes, así que cada cambio de plan se captura.

Economía unitaria — Vista por cuenta de MRR versus costo (uso de tokens). JieGou calcula el porcentaje de margen para cada cuenta, para que pueda identificar qué clientes son rentables y cuáles consumen más de lo que pagan. Los costos se rastrean desde registros de uso y se agregan mensualmente.

Las instantáneas de ingresos se almacenan diariamente, permitiendo comparación período sobre período y cálculo preciso de churn contra una línea base conocida.

Salud de facturación

Los ingresos se ven saludables en agregado, pero los problemas individuales de facturación pueden ocultarse en el ruido. El panel de salud de facturación los hace visibles:

Pagos fallidos — Cargos que fallaron en los últimos 30 días, con razón de falla y monto en riesgo
Suscripciones vencidas — Cuentas con pagos atrasados que necesitan atención de cobranza
Reembolsos recientes — Reembolsos emitidos en los últimos 30 días con códigos de razón
Renovaciones próximas — Suscripciones que se renuevan en los próximos 7 días, para que pueda abordar proactivamente cualquier problema
Reconciliación de ingresos — MRR esperado versus ingresos realmente cobrados (incluyendo cargos por exceso), con un porcentaje de discrepancia

Adopción de usuarios

Saber quién paga es una cosa. Saber quién realmente usa el producto es otra.

Usuarios activos — DAU, WAU y MAU rastreados vía Redis HyperLogLog. HyperLogLog da estimaciones de cardinalidad con menos de 2% de margen de error mientras usa memoria mínima — no necesita almacenar IDs individuales de usuario. La ratio DAU/MAU le dice de un vistazo qué tan pegajoso es el producto.

Adopción de funcionalidades — Diez funcionalidades clave se rastrean individualmente: chat, agente, flujos de trabajo, programaciones, disparadores, bakeoffs, ejecuciones por lotes, documentos, voz de marca y herramientas MCP. Para cada funcionalidad, ve cuentas únicas que la usan y conteo total de uso, más una tasa de adopción contra el total de cuentas que pagan.

Embudo de activación — Siete hitos desde el primer inicio de sesión hasta usuario avanzado: elegir departamento, ejecutar primera tarea de IA, dar retroalimentación, programar una tarea, invitar compañero de equipo, crear flujo de trabajo, ver tendencia de calidad. La tasa de conversión en cada etapa muestra dónde se atascan los usuarios.

Un gráfico de tendencia DAU de 30 días completa el panorama, mostrando conteos de usuarios activos diarios durante el último mes.

Monitoreo de disponibilidad y SLA

El tiempo de actividad no es opcional. El sistema de monitoreo de disponibilidad registra verificaciones de salud con resolución por minuto, rastreando el estado de los componentes Firestore y Redis.

Cálculo de tiempo de actividad — Porcentaje de tiempo de actividad del mes actual y de los últimos 30 días, medido contra un objetivo de SLA del 99.9%. Un indicador de estado se pone verde (>= 99.9%), amarillo (>= 99.5%) o rojo (< 99.5%). El presupuesto de error restante muestra cuántos minutos de degradación puede absorber antes de incumplir el SLA.

Detección automática de incidentes — Tres fallas consecutivas de verificación de salud crean automáticamente un registro de incidente. Los incidentes se categorizan por severidad (menor, mayor, crítico) basándose en cuántos componentes están afectados. Cuando la salud vuelve a la normalidad, el incidente se auto-resuelve.

Métricas de incidentes — MTTR (Tiempo medio de resolución) y MTBF (Tiempo medio entre fallas) en una ventana de 90 días. Estos son los números que los auditores y compradores empresariales solicitan.

API de estado pública — Un endpoint público en /api/health devuelve el estado actual con desglose por componente. No se requiere autenticación. Devuelve HTTP 200 cuando está saludable, 503 cuando está degradado.

Monitoreo de seguridad

Los incidentes de seguridad no se anuncian. La capa de monitoreo de seguridad vigila anomalías continuamente:

Detección de fuerza bruta — Rastreo de fallas de autenticación por IP con una ventana deslizante de 5 minutos. Más de 10 fallas en 5 minutos activa un bloqueo automático de IP. Las IPs únicas con fallas y los conteos de fallas de 24 horas son visibles de un vistazo.

Salud de claves API — La antigüedad de cada clave API, estado de validez y marca de tiempo de la última validación. Las claves con más de 90 días activan alertas de rotación. No debería necesitar recordar cuándo rotó por última vez — el panel se lo dice.

Detección de picos de uso — Una verificación diaria compara el uso de cada cuenta contra su promedio de los últimos 7 días. El uso que excede 3x el promedio genera una alerta, categorizada por severidad: baja (3-5x), media (5-10x), alta (>10x). Esto detecta claves comprometidas, automatizaciones descontroladas y patrones de uso inesperados.

Auditoría de cambios de roles — Todos los cambios de roles en los últimos 7 días, mostrando quién cambió a quién y cuáles eran los roles anteriores y nuevos. La escalación de permisos es el vector más común para amenazas internas — la visibilidad es la defensa.

Las alertas son descartables por el personal y se rastrean con metadatos de auditoría (quién descartó, cuándo).

Panel de cola de mensajes no entregados

Las operaciones asíncronas fallan. Los webhooks no se entregan. Los correos rebotan. Las ejecuciones programadas agotan el tiempo. El panel DLQ muestra todo en un solo lugar.

JieGou rastrea 15 categorías de operaciones asíncronas: entrega de webhooks, email, registros de auditoría, notificaciones, registros de uso, cargos por exceso, ejecuciones programadas, ejecuciones de disparadores, destinos de salida, sincronizaciones de conectores, resúmenes de insights, ejecuciones por lotes, ejecuciones de pipelines y notificaciones de Slack.

Para cada categoría, ve conteos de pendientes, reintentando y agotados, más una tasa de éxito de reintentos y la antigüedad de la entrada pendiente más vieja. Las operaciones fallidas se reintentan automáticamente con backoff exponencial — 1 minuto, 5 minutos, 15 minutos — hasta 3 intentos antes de marcarse como agotadas.

Esto no es solo un registro de errores. Es un panel operacional que le dice qué subsistemas necesitan atención y si el mecanismo de reintentos realmente se está recuperando de las fallas.

Todo en un solo lugar

El Operations Hub expandido reúne seis vistas que los equipos típicamente dispersan en múltiples herramientas:

Panorama de automatización — Salud a nivel departamental, dependencias entre departamentos
Gobernanza — Permisos de usuario, historial de cambios, niveles de cumplimiento
Ingresos y facturación — MRR, churn, salud de facturación, reconciliación
Adopción — DAU/WAU/MAU, uso de funcionalidades, embudo de activación
Disponibilidad — Tiempo de actividad, cumplimiento de SLA, historial de incidentes
Seguridad — Detección de fuerza bruta, salud de claves, anomalías de uso

Sin paneles de Grafana que mantener. Sin pestañas del panel de Stripe que malabarear. Sin herramientas de monitoreo de seguridad separadas. Una consola, un inicio de sesión, un conjunto de alertas.

Disponibilidad

Las vistas de panorama de automatización, gobernanza y analíticas de la organización están disponibles en todos los planes. Las analíticas de ingresos, monitoreo de disponibilidad y monitoreo de seguridad están disponibles en los planes Team y Enterprise. Conozca más sobre el Operations Hub o comience su prueba gratuita.