AI 自動化平台做出影響真實業務流程的決策。當一個配方產生客戶電子郵件,或一個工作流程核准採購單,或一個代理跨部門委派任務 — 輸出品質至關重要。如果平台有漏洞,業務就有漏洞。
這就是 JieGou 運行 24,000+ 項自動化測試、達到 99.18% 程式碼覆蓋率的原因。每晚執行。跨越所有 4 家 LLM 供應商。包含無障礙稽核、視覺回歸測試和 RBAC 執行驗證。
沒有其他 AI 自動化平台公開這些數據。大多數根本沒有。
為什麼測試對 AI 平台更加重要
傳統 SaaS 測試很直觀:給定輸入 X,預期輸出 Y。AI 自動化平台增加了三層複雜度:
- 非確定性輸出 — LLM 不會返回相同的回應。測試必須驗證結構、約束和品質,而非精確字串。
- 多供應商差異 — JieGou 支援 4 家 LLM 供應商(Anthropic、OpenAI、Google 及任何 OpenAI 相容端點)。每家有不同的能力、錯誤模式和回應格式。
- 編排複雜度 — 工作流程串連多個步驟,包含條件邏輯、平行執行、審批關卡和收斂迴圈。步驟 3 的漏洞可能透過共享狀態損壞步驟 7 的輸出。
這些挑戰正是測試紀律重要的原因。沒有它,你會發布無法重現的漏洞,因為它們只在特定 LLM 回應模式下出現。
24,000+ 項測試涵蓋什麼
單元測試 (Vitest)
我們測試套件的主體 — 伺服器端邏輯、資料轉換、驗證規則和業務邏輯:
- LLM 層:供應商路由、BYOK 金鑰解析、斷路器狀態機、併發限制、token 用量追蹤
- 工作流程引擎:步驟執行(配方、條件、迴圈、平行、審批、LLM、評估、路由器、聚合器)、DAG 執行、收斂迴圈、檢查點/恢復
- 安全:RBAC 執行(5 個角色的 20 項權限)、身份驗證守衛、API 金鑰加密/解密、會話管理
- SOC 2 證據:存取審查生成、加密清單、供應商登錄、事件回應手冊、稽核日誌摘要
- 資料層:Firestore CRUD、Redis 快取、速率限制、死信佇列
E2E 測試 (Playwright)
完整的瀏覽器自動化測試,驗證真實應用程式:
- 使用者旅程:管理員入職、部門主管審查、開發者工作流程建立
- 路由覆蓋:應用程式中的每條路由(組合包、實體、群組、整合、知識庫、錄製、定價、重定向)
- RBAC 執行:負面測試驗證未授權使用者收到 403
- 資料一致性:API 回應 ↔ UI 渲染驗證、併發操作處理
無障礙稽核 (@axe-core/playwright)
在關鍵頁面上進行 WCAG 2.1 AA 合規掃描:
- 色彩對比度
- ARIA 屬性正確性
- 鍵盤導航
- 螢幕閱讀器相容性
視覺回歸測試
Playwright 截圖比較以捕捉意外的 UI 變更:
- 跨視窗大小的元件渲染
- 主題一致性(明/暗)
- 依賴更新後的佈局穩定性
LLM 模擬測試
透過 llm-mock.ts(818 行)為所有 4 家 LLM 供應商提供確定性測試替身:
- 精確模擬每家供應商的回應格式
- 涵蓋工具呼叫、結構化輸出和串流
- 測試驗證逾時、速率限制和錯誤條件下的行為
- 自架 LLM 測試的自訂 OpenAI 相容端點模擬
效能基準
頁面載入指標作為測試斷言追蹤:
- 可互動時間
- 最大內容繪製
- 套件大小閾值
n8n 的對比
當我們每晚運行 24,000+ 項測試時,開源自動化平台 n8n 已累積 8 個嚴重 CVE — 其中數個只需工作流程編輯器存取權限(非管理員)即可執行遠端程式碼。Censys 發現 26,512 個暴露在公共網際網路上的 n8n 實例。
自架不等於自我保護。測試紀律才是。
測試如何支持 SOC 2
我們的測試套件不僅僅是抓漏洞。它是 SOC 2 證據收集的一部分:
- CC5.2(控制活動):測試套件本身就是品質控制的證據
- CC6.2(存取控制):RBAC 執行測試證明存取控制有效
- CC7.1(系統營運):每晚 CI 證明持續監控
- CC8.1(變更管理):每個 PR 在合併前運行完整測試套件
SOC 2 證據聚合器(/api/soc2-evidence)將測試覆蓋率作為關鍵指標引用。當稽核員問「你如何確保變更不會引入安全回歸?」時,我們有具體答案:24,000+ 項測試、99.18% 覆蓋率、每次提交。
每晚 CI 管線
每晚,我們的 CI 管線:
- 運行完整的 Vitest 單元測試套件(約 9,500 項測試)
- 對全新部署運行 Playwright E2E 測試(約 500 項測試)
- 在 20 多個關鍵頁面上運行無障礙稽核
- 運行視覺回歸比較
- 向團隊回報覆蓋率
如果任何測試失敗,團隊會在下一個工作日前收到通知。如果覆蓋率降至 98% 以下,建置會失敗。
自己試試
JieGou 可免費評估。此處提到的每項功能 — 4 供應商 LLM 支援、工作流程引擎、SOC 2 證據收集 — 都在企業方案中提供。