Skip to content
Produkt

Ihr Browser hat gerade einen KI-Copiloten bekommen: Chat, Befehle und agentisches Browsing

JieGous Browser-Extension enthält jetzt ein KI-Chat-Panel, eine Cmd+Shift+K-Befehlspalette, agentisches Browsing mit Tool-Genehmigung und Flow-Aufzeichnung. Ein KI-Assistent, der dort lebt, wo Sie arbeiten.

JT
JieGou Team
· · 6 Min. Lesezeit

Als wir die JieGou Browser-Extension gestartet haben, war sie ein Tool-Executor. Recipes und Workflows konnten über das Model Context Protocol 60+ Browser-Automatisierungs-Tools aufrufen — klicken, lesen, Formulare ausfüllen. Leistungsstark, aber passiv. Die Extension tat nur etwas, wenn ein Recipe sie dazu aufforderte.

Heute ist die Extension ein eigenständiger KI-Assistent. Öffnen Sie das Seitenpanel, stellen Sie eine Frage über die Seite, die Sie betrachten, und erhalten Sie eine Antwort, die versteht, was auf Ihrem Bildschirm ist. Nutzen Sie die Befehlspalette für Ein-Tastenanschlag-Aktionen. Lassen Sie den Agenten das Steuer übernehmen und autonom browsen. Zeichnen Sie Ihre Browser-Interaktionen auf und spielen Sie sie später ab.

KI-Chat mit Seitenbewusstsein

Klicken Sie auf das Extension-Icon oder nutzen Sie das Tastaturkürzel, um das Seitenpanel zu öffnen. Tippen Sie eine Frage, und die KI antwortet mit vollem Bewusstsein der Seite, auf der Sie sich befinden.

Die Extension sieht nicht nur die URL. Sie extrahiert den Textinhalt der Seite (bis zu 8.000 Zeichen) und erkennt, welche Plattform Sie nutzen — Gmail, Slack, Jira, Salesforce, Confluence, ServiceNow, LinkedIn oder HubSpot. Plattformerkennung löst spezialisierte Kontextextraktion aus, sodass die KI versteht, dass Sie ein Jira-Ticket oder einen Gmail-Thread betrachten, nicht nur eine generische Webseite.

Konversationen bleiben über Panel-Öffnungen hinweg erhalten. Schließen Sie das Seitenpanel, browsen Sie zu einer anderen Seite, öffnen Sie es wieder — Ihr Chat-Verlauf ist da. Bis zu 50 Nachrichten werden lokal in Ihrem Browser gespeichert, sodass nichts Ihre Maschine verlässt, es sei denn, Sie bitten die KI explizit, eine Aktion auszuführen.

Zwei Modi sind verfügbar: Standard-Chat für Fragen und Antworten, und Agent-Modus für mehrstufige Aktionen (mehr dazu unten). Wechseln Sie zwischen ihnen mit einem einzigen Klick.

Befehlspalette: Cmd+Shift+K

Drücken Sie Cmd+Shift+K (Mac) oder Ctrl+Shift+K (Windows/Linux) und eine durchsuchbare Palette erscheint mit 10 eingebauten Aktionen:

Seitenaktionen:

  • Screenshot Page — Erfasst das Viewport als PNG, kopiert in die Zwischenablage
  • Copy as Markdown — Extrahiert den Seiteninhalt als sauberes Markdown
  • Extract All Links — Zieht jeden Link von der Seite
  • Extract Tables as CSV — Konvertiert HTML-Tabellen ins CSV-Format
  • Save to Notepad — Speichert Inhalte im lokalen Speicher für später

KI-Aktionen:

  • Summarize Page — KI-generierte Zusammenfassung der aktuellen Seite
  • Extract Structured Data — Zieht strukturierte Informationen aus unstrukturiertem Inhalt
  • Draft Reply — Generiert eine kontextbezogene Antwort (nützlich für E-Mails und Threads)
  • Explain This — Verständliche Erklärung technischer Inhalte

Navigation:

  • Search Open Tabs — Fuzzy-Suche über alle offenen Browser-Tabs

Tippen Sie zum Filtern, Pfeiltasten zum Navigieren, Enter zum Ausführen. Ergebnisse werden automatisch in Ihre Zwischenablage kopiert.

Über die eingebauten Aktionen hinaus können Sie benutzerdefinierte Aktionen erstellen. Definieren Sie ein Prompt-Template mit Variablen wie {selectedText}, {pageUrl} und {pageTitle}, und Ihre Aktion erscheint in der Palette neben den Standards. Wenn Ihr Team eine Standardmethode hat, Support-Tickets zusammenzufassen oder Aufgaben aus Meeting-Notizen zu extrahieren, speichern Sie es als benutzerdefinierte Aktion — es ist immer nur einen Tastenanschlag entfernt.

Agentisches Browsing

Standard-Chat beantwortet Fragen. Agent-Modus ergreift Maßnahmen.

Wenn Sie den Agent-Modus aktivieren, tritt die KI in eine Multi-Turn-Schleife ein. Sie kann Browser-Tool-Aufrufe vorschlagen — diesen Button klicken, dieses Formular ausfüllen, zu einer anderen Seite navigieren — und die Extension führt sie nach Ihrer Genehmigung aus.

So funktioniert der Genehmigungsablauf:

  1. Sie tippen eine Anweisung: „Finde die neueste Rechnung in meiner E-Mail und leite sie an buchhaltung@firma.de weiter”
  2. Die KI plant ihren Ansatz und schlägt Tool-Aufrufe vor: zu Gmail navigieren, nach „Rechnung” suchen, das neueste Ergebnis öffnen
  3. Jeder Tool-Call erscheint in einer Karte mit Aktionsname und Parametern. Nur-Lese-Tools (Seiteninhalt lesen, Screenshots erstellen) werden automatisch ausgeführt. Mutations-Tools (klicken, tippen, navigieren) warten auf Ihre Genehmigung.
  4. Einzeln genehmigen oder „Alle genehmigen” klicken, damit der Agent die verbleibenden Schritte durchläuft.

Der Agent läuft bis zu 10 Turns, bevor er pausiert, sodass er nicht endlos loopt. Sie können ihn jederzeit stoppen.

Technisch agiert die Extension als clientseitiger Orchestrator. Sie sendet Konversationskontext an den JieGou-Server, der die Anfrage an das LLM weiterleitet. Die Tool-Call-Vorschläge des LLM werden via Server-Sent Events zurückgestreamt. Die Extension parst den Stream, kategorisiert jeden Tool-Call als Nur-Lese oder Mutation und behandelt den Genehmigungsablauf lokal. Die Tool-Ausführung erfolgt vollständig in Ihrem Browser — der Server sieht den Seiteninhalt nie.

Flow-Aufzeichnung und -Wiedergabe

Manchmal brauchen Sie die KI nicht, um herauszufinden, was zu tun ist — Sie brauchen sie nur, um zu wiederholen, was Sie bereits getan haben.

Klicken Sie im Seitenpanel auf „Record” und interagieren Sie dann normal mit Ihrem Browser. Buttons klicken, Formulare ausfüllen, zwischen Seiten navigieren. Die Extension erfasst jede Interaktion als strukturierten Schritt: Klick, Ausfüllen, Scrollen, Tastatureingabe, Tab-Wechsel.

Wenn Sie die Aufzeichnung stoppen, haben Sie einen abspielbaren Flow. Jeder Schritt wird einem Browser-Automatisierungs-Tool-Call zugeordnet (chrome_click_element, chrome_fill_or_select, usw.), sodass die Wiedergabe dieselbe zuverlässige Automatisierungsinfrastruktur wie Recipes und Workflows nutzt.

Flows unterstützen:

  • Variablen — Schritte mit {{variableName}}-Platzhaltern parametrisieren. Ein Login-Flow wird über Konten hinweg wiederverwendbar, indem Benutzername und Passwort zu Variablen werden.
  • Geschwindigkeitskontrolle — Abspielen mit 0,5x, 1x oder 2x Geschwindigkeit
  • Schritt-für-Schritt-Modus — Nach jedem Schritt für Verifikation pausieren
  • Bei Fehler fortfahren — Optional fehlgeschlagene Schritte überspringen statt anzuhalten
  • Ausführungshistorie — Jede Wiedergabe wird mit Pro-Schritt-Erfolgs-/Fehlerstatus, Timing und Fehlerdetails aufgezeichnet

Flows werden lokal in IndexedDB gespeichert — keine Cloud-Abhängigkeit für grundlegende Aufzeichnung und Wiedergabe. Sie können Flows als JSON-Dateien exportieren, um sie mit Teammitgliedern zu teilen oder auf einer anderen Maschine zu importieren.

Plattformspezifische Intelligenz

Der KI-Assistent erbt alle 60+ Browser-Automatisierungs-Tools der Extension, plus plattformspezifische Handler für sechs Enterprise-Anwendungen:

  • Gmail — Threads lesen, E-Mails verfassen, Posteingang durchsuchen
  • Slack — Nachrichten lesen, in Channels posten
  • Jira — Issues erstellen, Tickets aktualisieren, Sprint-Daten lesen
  • Salesforce — Datensätze lesen und aktualisieren
  • ServiceNow — Incidents verwalten
  • HubSpot — Kontakte und Kampagnen abrufen

Diese Handler verstehen die DOM-Struktur jeder Plattform, sodass die KI auf semantischer Ebene arbeitet — „lies die neueste E-Mail von Sarah” statt „klicke auf das Element am Selektor div.adn.ads > div:nth-child(3).”

Datenschutz und Sicherheit

Der KI-Assistent läuft in Ihrem Browser. Seiteninhalt wird lokal extrahiert und nur an das LLM gesendet, wenn Sie eine Frage stellen oder eine Aktion auslösen. BYOK gilt — wenn Sie Ihre eigenen API-Schlüssel verwenden, fließen die Daten direkt zwischen Ihrem Browser und dem LLM-Anbieter.

Chat-Verlauf, aufgezeichnete Flows, benutzerdefinierte Aktionen und Einstellungen werden alle im lokalen Speicher Ihres Browsers gespeichert. Nichts wird mit JieGous Servern synchronisiert, es sei denn, es ist Teil einer Recipe- oder Workflow-Ausführung.

Erste Schritte

Aktualisieren Sie Ihre JieGou Browser-Extension auf die neueste Version. Das KI-Chat-Panel, die Befehlspalette und die Aufzeichnungsfunktionen sind sofort verfügbar. Der Agent-Modus ist in Pro-Tarifen und höher verfügbar. Mehr über die Browser-Extension erfahren oder aus dem Extension-Store installieren.

browser-extension ai-assistant command-palette agentic-browsing flow-recording
Diesen Artikel teilen

Hat Ihnen dieser Artikel gefallen?

Erhalten Sie Workflow-Tipps, Produktupdates und Automatisierungsleitfäden direkt in Ihren Posteingang.

No spam. Unsubscribe anytime.