Skip to content
產品

Operations Hub:在單一儀表板中監控營收、可用性與安全性

JieGou 的 Operations Hub 現在可追蹤 MRR/ARR、帳務健康狀態、使用者採用率、SLA 合規性和安全威脅——經營 SaaS 業務所需的一切,與您的 AI 自動化指標並列呈現。

JT
JieGou Team
· · 4 分鐘閱讀

JieGou 的 Operations Hub 最初是一個讓您查看 AI 自動化運作狀況的地方——哪些部門正在活動、誰擁有什麼權限、正在執行多少次運行。實用,但不夠完整。如果您在 JieGou 上經營業務,您需要看到的不僅僅是自動化指標。

今天我們正在擴展 Operations Hub,新增營收分析、可用性監控、帳務健康狀態、使用者採用率追蹤、安全監控和死信佇列儀表板。這是一個完整的 SaaS 營運中心。

營收分析

營收儀表板從 Stripe 提取即時資料,呈現最重要的數字:

MRR 和 ARR — 根據活躍訂閱計算,並針對年度方案進行標準化。您可以看到總 MRR、按方案等級的細分,以及趨勢追蹤資料。ARPU 會根據付費帳戶數量自動計算。

流失率與留存率 — 客戶流失率(流失的帳戶數)、營收流失率(流失的 MRR)和淨營收留存率(NRR)。NRR 將升級帶來的擴展營收和降級帶來的收縮納入計算,讓您全面了解現有客戶是在成長還是萎縮。擴展和收縮透過 Stripe 訂閱更新事件搭配 previous_attributes 比對來追蹤,因此每次方案變更都會被記錄。

單位經濟效益 — 按帳戶檢視 MRR 與成本(token 使用量)的對比。JieGou 會計算每個帳戶的利潤率百分比,讓您能識別哪些客戶是有利潤的,哪些客戶的消耗超過了他們的付費金額。成本從使用記錄中追蹤,並按月彙總。

營收快照每日儲存,可進行期間對比和基於已知起始基線的準確流失率計算。

帳務健康狀態

整體營收看起來可能很健康,但個別帳務問題可能隱藏在資料噪音中。帳務健康儀表板會將這些問題浮現出來:

  • 失敗的付款 — 過去 30 天內失敗的扣款,包含失敗原因和風險金額
  • 逾期訂閱 — 有逾期付款需要催收處理的帳戶
  • 近期退款 — 過去 30 天內發出的退款及原因代碼
  • 即將到期的續約 — 未來 7 天內即將續約的訂閱,讓您能主動處理任何問題
  • 營收對帳 — 預期 MRR 與實際收取的營收(包含超額費用)對比,並顯示差異百分比

使用者採用率

知道誰在付費是一回事。知道誰真正在使用產品是另一回事。

活躍使用者 — DAU、WAU 和 MAU 透過 Redis HyperLogLog 追蹤。HyperLogLog 在使用極少記憶體的情況下提供低於 2% 誤差範圍的基數估計——無需儲存個別使用者 ID。DAU/MAU 比率讓您一目了然地了解產品的黏著度。

功能採用率 — 個別追蹤十個關鍵功能:聊天、代理、workflows、排程、觸發器、比較測試、批次運行、文件、品牌語調和 MCP 工具。對於每個功能,您可以看到使用它的唯一帳戶數和總使用次數,加上相對於總付費帳戶的採用率。

啟用漏斗 — 從首次登入到進階使用者的七個里程碑:選擇部門、執行首次 AI 任務、提供回饋、排程任務、邀請團隊成員、建立 workflow、查看品質趨勢。每個階段的轉換率顯示使用者在哪裡卡住。

30 天 DAU 趨勢圖表完善了整體畫面,顯示過去一個月的每日活躍使用者數量。

可用性與 SLA 監控

正常運行時間不是可選項。可用性監控系統以每分鐘的解析度記錄健康檢查,追蹤 Firestore 和 Redis 元件狀態。

正常運行時間計算 — 當月和滾動 30 天的正常運行時間百分比,以 99.9% 的 SLA 目標為基準。狀態指示燈會顯示為綠色(>= 99.9%)、黃色(>= 99.5%)或紅色(< 99.5%)。剩餘錯誤預算顯示在違反 SLA 之前還能承受多少分鐘的服務降級。

自動事件偵測 — 連續三次健康檢查失敗會自動建立一筆事件記錄。事件根據受影響的元件數量按嚴重程度分類(輕微、重大、嚴重)。當健康狀態恢復正常時,事件會自動解決。

事件指標 — 90 天窗口內的 MTTR(平均修復時間)和 MTBF(平均故障間隔時間)。這些是稽核人員和企業買家會要求的數字。

公開狀態 API/api/health 上的公開端點會回傳當前狀態及各元件的細分。無需身份驗證。健康時回傳 HTTP 200,降級時回傳 503。

安全監控

安全事件不會自我宣告。安全監控層持續監視異常行為:

暴力破解偵測 — 以 5 分鐘滑動窗口追蹤每個 IP 的身份驗證失敗次數。5 分鐘內超過 10 次失敗會觸發自動 IP 封鎖。唯一失敗 IP 數量和 24 小時失敗次數一目了然。

API 金鑰健康狀態 — 每個 API 金鑰的使用天數、有效性狀態和最後驗證時間戳記。超過 90 天的金鑰會觸發輪換提醒。您不需要記住上次輪換是什麼時候——儀表板會告訴您。

使用量異常偵測 — 每日檢查將每個帳戶的使用量與其過去 7 天的平均值進行比較。使用量超過平均值 3 倍會產生警報,並按嚴重程度分類:低(3-5 倍)、中(5-10 倍)、高(>10 倍)。這可以捕獲被盜用的金鑰、失控的自動化和意外的使用模式。

角色變更稽核 — 過去 7 天內的所有角色變更,顯示誰變更了誰的角色,以及舊角色和新角色分別是什麼。權限提升是內部威脅最常見的手段——可見性就是最好的防禦。

警報可由工作人員關閉,並附帶稽核元資料追蹤(誰關閉的、何時關閉的)。

死信佇列儀表板

非同步操作會失敗。Webhook 無法送達。電子郵件被退回。排程運行逾時。DLQ 儀表板將所有這些集中在一個地方顯示。

JieGou 追蹤 15 類非同步操作:webhook 送達、電子郵件、稽核日誌、通知、使用記錄、超額費用、排程運行、觸發器運行、輸出目的地、連接器同步、洞察摘要、批次執行、管線運行和 Slack 通知。

對於每個類別,您可以看到待處理、重試中和已耗盡的計數,加上重試成功率和最舊待處理項目的存在時間。失敗的操作會以指數退避方式自動重試——1 分鐘、5 分鐘、15 分鐘——最多 3 次嘗試,之後標記為已耗盡。

這不僅僅是一個錯誤日誌。它是一個營運儀表板,告訴您哪些子系統需要關注,以及重試機制是否真正在從故障中恢復。

一切集中在一處

擴展後的 Operations Hub 將團隊通常分散在多個工具中的六個視圖整合在一起:

  1. 自動化全景 — 部門層級的健康狀態、跨部門依賴關係
  2. 治理 — 使用者權限、變更歷史、合規等級
  3. 營收與帳務 — MRR、流失率、帳務健康狀態、對帳
  4. 採用率 — DAU/WAU/MAU、功能使用率、啟用漏斗
  5. 可用性 — 正常運行時間、SLA 合規性、事件歷史
  6. 安全性 — 暴力破解偵測、金鑰健康狀態、使用量異常

不需要維護 Grafana 儀表板。不需要在 Stripe 儀表板分頁之間切換。不需要額外的安全監控工具。一個控制台、一次登入、一組警報。

可用性

自動化全景、治理和組織分析視圖在所有方案中均可使用。營收分析、可用性監控和安全監控在 Team 和 Enterprise 方案中提供。深入了解 Operations Hub開始免費試用

operations-hub monitoring revenue availability security saas
分享這篇文章

喜歡這篇文章嗎?

在您的信箱中獲取工作流程技巧、產品更新和自動化指南。

No spam. Unsubscribe anytime.