Skip to content
Produkt

Browser-Automatisierung mit MCP: 60+ Tools im Zugriff der KI

Wie JieGous Browser-Extension das Model Context Protocol nutzt, um KI direkten Zugriff auf Ihren Browser zu geben — Klicken, Lesen, Formulare ausfüllen und mehr auf Gmail, Slack, Jira und anderen Plattformen.

JT
JieGou Team
· · 5 Min. Lesezeit

Die meisten KI-Automatisierungsplattformen verbinden sich über APIs mit Ihren Tools. Das funktioniert gut für strukturierte Daten — ein Jira-Ticket lesen, einen Salesforce-Kontakt abrufen — verfehlt aber alles, was im Browser passiert. Die E-Mail, die Sie in Gmail verfassen. Der Slack-Thread, den Sie lesen. Das Formular, das Sie in ServiceNow ausfüllen.

JieGous Browser-Extension überbrückt diese Lücke. Mithilfe des Model Context Protocol (MCP) gibt sie der KI direkten Zugriff auf 60+ Browser-Automatisierungs-Tools — vom Klicken auf Buttons bis zum Lesen von Seiteninhalten bis zum Erfassen von Netzwerkverkehr.

Was ist MCP?

Das Model Context Protocol ist ein offener Standard zur Verbindung von KI-Modellen mit externen Tools und Datenquellen. Anstatt für jeden Dienst einzelne API-Integrationen zu erstellen, bietet MCP eine universelle Schnittstelle, die jedes KI-Modell nutzen kann, um Tools zu entdecken und aufzurufen.

JieGous Browser-Extension implementiert einen MCP-Client, der sich über WebSocket mit dem JieGou-Server verbindet. Wenn ein Recipe oder Workflow mit einem browserbasierten Tool interagieren muss, sendet es einen MCP-Tool-Call über diese Verbindung, und die Extension führt ihn im Browser des Benutzers aus.

Was kann die Extension?

Die 60+ Tools fallen in mehrere Kategorien:

Seiteninteraktion — Elemente klicken, Formularfelder ausfüllen, Dropdowns auswählen, Checkboxen ankreuzen, scrollen und zwischen Seiten navigieren. Die KI kann Ihren Browser so bedienen wie Sie.

Inhalte lesen — Sichtbaren Text einer Seite lesen, bestimmte Elemente per CSS-Selektor extrahieren, Seitentitel und URL abrufen und die vollständige DOM-Struktur erfassen. Das gibt der KI Kontext darüber, was Sie sich ansehen.

Screenshots — Das sichtbare Viewport oder ein bestimmtes Element aufnehmen. Nützlich für visuelle Verifikation des UI-Zustands oder als Eingabe für multimodale KI-Modelle.

Netzwerk-Erfassung — Netzwerkanfragen und -antworten überwachen und erfassen. Das hilft der KI zu verstehen, welche Daten zwischen Browser und Backend-Diensten fließen.

Plattformspezifische Tools — Spezialisierte Handler für Gmail (verfassen, lesen, E-Mails suchen), Slack (Nachrichten lesen, in Channels posten), Jira (Issues erstellen, Tickets aktualisieren), Salesforce (Datensätze lesen, Felder aktualisieren), ServiceNow (Incidents verwalten) und HubSpot (Kontakte und Kampagnen abrufen).

Das dedizierte Automatisierungsfenster

Bei komplexen Automatisierungen möchten Sie nicht, dass die KI in Ihrem aktiven Browser-Tab herumklickt. JieGou öffnet ein dediziertes Automatisierungsfenster — einen isolierten Browser-Kontext, in dem MCP-Tools ausgeführt werden, ohne Ihre Arbeit zu beeinträchtigen.

Dieses Fenster läuft im Hintergrund, sodass Automatisierungen weiterlaufen, während Sie den Browser für andere Aufgaben nutzen. Ergebnisse werden in Echtzeit an die Konsole gestreamt.

Wie es sich mit Recipes und Workflows verbindet

Browser-Tools erscheinen neben allen anderen Tools im Recipe-Editor und Workflow-Builder. Wenn Sie ein Recipe erstellen, das Daten von einer Webseite lesen oder ein Formular ausfüllen muss, wählen Sie das relevante Browser-Tool aus der Tool-Liste.

Während der Ausführung leitet JieGou den Tool-Call an die Browser-Extension weiter, wartet auf das Ergebnis und speist es zurück in den Recipe- oder Workflow-Schritt. Die KI behandelt Browser-Tools genau wie API-Tools — es gibt keine spezielle Syntax oder Konfiguration.

Plattformspezifische Intelligenz

Die Extension interagiert nicht nur generisch mit Webseiten. Für unterstützte Plattformen hat sie spezialisierte Inject-Scripts, die die DOM-Struktur der Plattform verstehen und aussagekräftige Daten extrahieren können.

Zum Beispiel kann der Gmail-Handler E-Mail-Threads identifizieren, Absender- und Empfängerinformationen extrahieren, Nachrichtentexte lesen und neue E-Mails verfassen — alles durch Verständnis der spezifischen HTML-Struktur von Gmail. Der Jira-Handler weiß, wie Issue-Felder, Kommentare und Sprint-Daten aus Jiras Oberfläche gelesen werden.

Diese plattformspezifische Intelligenz bedeutet, dass die KI auf einer höheren Abstraktionsebene mit Ihren Tools arbeiten kann als rohe DOM-Manipulation.

Sicherheit und Berechtigungen

Die Browser-Extension erfordert explizite Benutzerautorisierung und arbeitet innerhalb mehrerer Sicherheitsschichten.

Authentifizierung und Autorisierung. Die Extension verbindet sich mit JieGous MCP-Server über JWT-basierte Authentifizierung. Jede WebSocket-Verbindung wird gegen die Session des Benutzers verifiziert, und die Extension kann ohne gültiges, aktives Token keine Tools ausführen. Token sind kurzlebig und auf die Kontoberechtigungen des Benutzers begrenzt.

API-Schlüssel-Validierung. Vor dem Dispatch jedes Tool-Calls validiert das System, dass die API-Schlüssel des Benutzers aktiv und korrekt konfiguriert sind. Ungültige oder widerrufene Schlüssel werden abgewiesen, bevor sie den Browser erreichen, um unautorisierte Automatisierungsversuche zu verhindern.

Rate-Limiting. Pro-Benutzer- und Pro-Tool-Ratenlimits verhindern Missbrauch und versehentliche unkontrollierte Automatisierung. Wenn ein Workflow eine ungewöhnlich hohe Anzahl von Browser-Aktionen auslöst, drosselt Rate-Limiting die Ausführung, anstatt die Zielanwendung zu überlasten.

Audit-Logging. Jeder Tool-Call wird mit Benutzer, Tool-Name, Zeitstempel, Ziel-URL und Ergebnisstatus protokolliert. Diese Audit-Einträge sind abfragbar und exportierbar und geben Admins volle Transparenz darüber, welche Browser-Automatisierung durchgeführt wurde und von wem.

Tool-ACLs. Administratoren können Allow- und Deny-Listen konfigurieren, die steuern, welche Browser-Tools welchen Rollen zur Verfügung stehen. Ein Support-Team hat möglicherweise Zugriff auf Ticket-Management-Tools, aber nicht auf Tools, die CRM-Datensätze ändern. ACLs werden auf Server-Ebene durchgesetzt, bevor Tool-Calls die Extension erreichen.

BYOK-Kompatibilität. Bring Your Own Keys gilt für Browser-Automatisierung genauso wie für LLM-Aufrufe — die Extension arbeitet in Ihrem Browser, und Daten fließen zwischen Ihrem Browser und den Webanwendungen, die Sie nutzen. JieGou orchestriert die Automatisierung, sieht aber den Seiteninhalt nicht.

Erste Schritte

Die Browser-Extension ist für Chrome und Firefox verfügbar. Installieren Sie sie aus dem Extension-Store, melden Sie sich mit Ihrem JieGou-Konto an, und Browser-Tools stehen sofort in Ihren Recipes und Workflows zur Verfügung. Mehr über Browser-Automatisierung erfahren oder alle Integrationen ansehen.

browser-extension mcp automation integrations
Diesen Artikel teilen

Hat Ihnen dieser Artikel gefallen?

Erhalten Sie Workflow-Tipps, Produktupdates und Automatisierungsleitfäden direkt in Ihren Posteingang.

No spam. Unsubscribe anytime.