Workflows entwerfen, die elegant scheitern

Traditionelle Automatisierung funktioniert entweder oder nicht. Ein Zapier-Zap verschiebt Daten von A nach B — wenn der API-Aufruf fehlschlägt, wird es wiederholt. Die Ausgabe ist jedes Mal dieselbe.

KI-Workflows sind anders. Ein Modell könnte unter Last zeitüberschreiten. Ein Ratenlimit könnte Ihre Anfragen drosseln. Die Ausgabe könnte gültig sein, aber das Ziel verfehlen. Und weil KI-Workflows oft mehrere Schritte haben, sollte ein Fehler in Schritt 3 die erfolgreichen Ergebnisse der Schritte 1 und 2 nicht verlieren.

Für diese Realitäten zu entwerfen ist der Unterschied zwischen Workflows, denen Ihr Team vertraut, und Workflows, die sie nach der ersten schlechten Erfahrung aufgeben.

Automatische Wiederholungsversuche mit Backoff

JieGou wiederholt fehlgeschlagene Recipe-Schritte automatisch mit exponentiellem Backoff. Wenn ein Schritt wegen eines vorübergehenden Fehlers fehlschlägt — Ratenlimits (429), Serverfehler (502, 503) oder Timeouts — wartet das System und wiederholt, wobei es exponentiell zurückfährt (2s, 4s, 8s, bis zu 30s) mit zufälligem Jitter, um Thundering-Herd-Probleme zu vermeiden.

Sie konfigurieren die maximale Wiederholungszahl pro Schritt. Für die meisten Recipes bewältigen 2-3 Wiederholungen vorübergehende Fehler, ohne den Workflow erheblich zu verzögern. Für hochvolumige Workflows, bei denen Ratenlimits häufig sind, können Sie höhere Wiederholungszahlen einstellen.

Permanente Fehler — ungültige Eingabe, Authentifizierungsfehler, Modellverweigerungen — überspringen Wiederholungen ganz. Es hat keinen Sinn, eine Anfrage zu wiederholen, die jedes Mal auf dieselbe Weise fehlschlagen wird.

Fehlerklassifizierung ist wichtig

Nicht alle Fehler sind gleich. JieGou klassifiziert Fehler in Kategorien, damit der Workflow angemessen reagieren kann:

Vorübergehende Fehler (wiederholbar): Ratenlimits, Serverüberlastungen, Netzwerk-Timeouts. Diese lösen sich von selbst mit Wiederholungen.
Permanente Fehler (nicht wiederholbar): Ungültige Eingabe, Authentifizierungsfehler, Content-Policy-Verletzungen. Diese erfordern menschliches Eingreifen oder Eingabeänderungen.
Teilerfolg: Die KI hat eine Ausgabe zurückgegeben, aber sie entspricht nicht vollständig dem erwarteten Schema. Der Workflow kann mit dem fortfahren, was er hat, oder das Problem zur Überprüfung markieren.

Diese Klassifizierung ist automatisch. Sie müssen keine Fehlerbehandlungslogik schreiben — der Executor weiß, welche HTTP-Statuscodes vorübergehend und welche permanent sind.

Genehmigungsschritte als Sicherheitsnetz

Genehmigungsschritte dienen nicht nur der geschäftlichen Prozessfreigabe. Sie sind auch Zuverlässigkeits-Checkpoints.

Platzieren Sie einen Genehmigungsschritt nach jedem Schritt, bei dem die Ausgabequalität für nachfolgende Schritte wichtig ist. Zum Beispiel:

Interessent recherchieren (Recipe-Schritt)
Recherchequalität prüfen (Genehmigungsschritt)
Kontaktaufnahme basierend auf Recherche entwerfen (Recipe-Schritt)

Wenn der Rechercheschritt magere Ergebnisse liefert — vielleicht ist das Unternehmen klein und es gibt begrenzte öffentliche Informationen — lässt der Genehmigungsschritt einen Menschen entscheiden, ob er mit dem Vorhandenen fortfährt oder zusätzlichen Kontext bereitstellt, bevor der Kontaktaufnahme-Entwurf erfolgt.

Ohne den Schritt würde der Kontaktaufnahme-Schritt eine E-Mail basierend auf unvollständiger Recherche generieren, was eine generische Nachricht produziert, die den Zweck der Automatisierung verfehlt.

Bedingungsschritte zur Ausgabevalidierung

Nutzen Sie Bedingungsschritte, um die Ausgabequalität vor dem Fortfahren zu prüfen:

Rechnungsdaten extrahieren (Recipe-Schritt)
Bedingung: Wenn total_amount existiert und line_items nicht leer ist (Bedingungsschritt)
- Dann: Weiter zur Unstimmigkeitsprüfung
- Sonst: Zur manuellen Bearbeitung markieren

Dies fängt Fälle ab, in denen die KI Schlüsselfelder nicht extrahieren konnte — vielleicht war das Rechnungsformat ungewöhnlich oder der Text schlecht gescannt. Anstatt unvollständige Daten an den nächsten Schritt weiterzugeben, leitet der Workflow sie an einen Menschen weiter.

Webhook-Benachrichtigungen bei Fehler

Workflows können Webhook-Benachrichtigungen senden, wenn sie abgeschlossen werden — ob erfolgreich oder mit Fehlern. Konfigurieren Sie einen Ausgabe-Webhook, um Ihr Team zu benachrichtigen, wenn ein Workflow fehlschlägt:

In einen Slack-Channel posten, wenn ein geplanter Workflow einen Fehler hat
An PagerDuty senden für kritische Workflows, die sofortige Aufmerksamkeit benötigen
Ein Status-Dashboard mit Workflow-Gesundheit aktualisieren

Die Webhook-Payload enthält die Lauf-ID, Status, welcher Schritt fehlgeschlagen ist und die Fehlerdetails. Ihr Team erhält handlungsorientierte Informationen, nicht nur „etwas ist kaputtgegangen.”

Parallele Ausführung und Teilfehler

Parallele Schritte führen mehrere Verzweigungen gleichzeitig aus. Wenn eine Verzweigung fehlschlägt, fahren die anderen Verzweigungen fort. Das ist beabsichtigt — ein Fehler in einer unabhängigen Verzweigung sollte nicht zusammenhängende Arbeit blockieren.

Nach Abschluss der parallelen Ausführung können Sie prüfen, welche Verzweigungen erfolgreich waren und welche fehlgeschlagen sind. Ein Bedingungsschritt nach dem parallelen Block kann den Workflow basierend darauf routen, ob alle Verzweigungen abgeschlossen wurden oder einige fehlgeschlagen sind.

Für das 95. Perzentil entwerfen

Die meisten KI-Aufrufe sind beim ersten Versuch erfolgreich. Die meisten Ausgaben entsprechen dem erwarteten Schema. Die meisten Workflows laufen ohne Probleme. Aber „die meisten” reicht nicht, wenn Sie Workflows täglich für ein Team ausführen, das auf die Ergebnisse angewiesen ist.

Entwerfen Sie Ihre Workflows für den 5-%-Fall:

Wiederholungen hinzufügen zu jedem Recipe-Schritt. Die Kosten einiger zusätzlicher API-Aufrufe bei Fehler sind vernachlässigbar im Vergleich zu den Kosten eines fehlgeschlagenen Workflow-Laufs.
Genehmigungsschritte hinzufügen vor hochwertigen Ausgaben. Wenn der Workflow Content generiert, der an Kunden oder Führungskräfte geht, sollte ein Mensch ihn verifizieren.
Bedingungsprüfungen hinzufügen nach Extraktionsschritten. Verifizieren Sie, dass die KI die benötigten Daten tatsächlich extrahiert hat, bevor Sie sie weiterleiten.
Webhook-Benachrichtigungen konfigurieren für geplante und ausgelöste Workflows. Wenn niemand die UI beobachtet, brauchen Sie Alerts, wenn etwas schiefgeht.

Das Ziel sind Workflows, die elegant degradieren — Probleme an Menschen weiterleiten, anstatt still schlechte Ausgaben zu produzieren.