
KI-Agenten entwickeln sich endlich von netten Demos zu echten produktiven Workflows. Mit AWS AgentCore können Teams Agenten entwickeln, die Tickets erstellen, APIs aufrufen, Infrastruktur bereitstellen, externe Tools ausführen und Änderungen schneller vornehmen, als es ein menschlicher Operator jemals könnte.
Das ist leistungsstark, führt aber auch zu einer völlig neuen betrieblichen und sicherheitsrelevanten Angriffsfläche. Und hier ist die unbequeme Wahrheit: Die meisten Unternehmen haben keine Ahnung, was ihre Agenten tatsächlich tun.
Agentische KI ist keine Magie. Sie ist eine privilegierte Automatisierungsschicht, die dieselbe Observability benötigt, die Sie von Kubernetes, Lambda oder jedem anderen kritischen Service erwarten. Wenn Sie keine Logs herausbekommen, sind Sie blind.
Aus diesem Grund haben wir die Sumo Logic Amazon Bedrock AgentCore App entwickelt. Nicht, um weitere Dashboards um ihrer selbst willen hinzuzufügen, sondern um Teams die Sichtbarkeit zu geben, die sie benötigen, um agentische Workflows sicher und vorhersehbar zu betreiben. Die App dient als Blaupause für etwas Größeres: wie effektives KI-Logging aussehen sollte.
Dieser Blog ist keine Produktvorstellung. Er ist ein praktisches Argument dafür, warum das Logging Ihrer KI wichtig ist und wie AgentCore den Weg nach vorn aufzeigt.
KI-Agenten sind die neuen privilegierten Dienstkonten
Nur dass sie autonom Entscheidungen treffen.
AgentCore-Agenten können Aktionen in Ihrem Stack auslösen, etwa Cloud-Ressourcen erstellen, sich in SaaS-Apps integrieren, Code ausführen, Daten abrufen oder Systeme aktualisieren – allein basierend auf ihren Anweisungen und ihrem Kontext. Wenn ein Praktikant über diesen Zugriff verfügen würde und Sie nicht protokollieren würden, was er tut, würden Sie das innerhalb von fünf Minuten abstellen. Wenn ein KI-Agent es tut, zucken viele Teams mit den Schultern und sagen: „Das ist eben KI.“
Das ist nicht nachhaltig. Wenn ein Agent die Produktion beeinflussen kann, benötigen Sie vollständige Transparenz über alle seine Handlungen.
Die fünf Log-Kategorien, die Sie in jedem KI-System überwachen müssen
Im Folgenden finden Sie fünf Log-Kategorien, die Sie in jedem KI-System überwachen sollten. AgentCore stellt sie nativ über CloudWatch und CloudTrail bereit, und die Sumo-Logic-App visualisiert sie. Aber diese Kategorien gelten für jede agentenbasierte KI-Plattform.
Runtime-Logs: Was der Agent tatsächlich getan hat
Dies umfasst Ausführungsspuren, Operationen, Fehler, Wiederholungen, Ausgaben und Aktivitäten auf Schritt-Ebene. Dies ist Ihre Incident-Timeline und Ihr Audit-Trail. Wenn etwas schiefgeht, beantworten diese Logs die Frage: „Was hat der Agent in den Momenten davor getan?“
Gateway-Logs: Welche externen Systeme der Agent berührt hat
Die meisten „gefährlichen“ Aspekte agentischer KI betreffen die Interaktion mit externen APIs und Services. Gateway-Logs zeigen genau, welche Aufrufe wohin und mit welchen Ergebnissen vorgenommen wurden. Hier erkennen Sie Fehlkonfigurationen oder wiederholte Fehler.
Memory-Logs: Was der Agent gespeichert oder abgerufen hat
Memory ist im Wesentlichen eine dynamische Wissensbasis, die vom Modell gesteuert wird. Schreiben, Lesen und Aktualisieren sollten immer protokolliert werden, damit Sie nachvollziehen können, wie Ihre Agenten ihren Kontext weiterentwickeln.
Eingebaute Tools (Browser und Code-Interpreter)
Dies sind Bereiche mit hohem Risiko. Wenn der Agent URLs besucht, Code ausführt oder Skripte ausführt, möchten Sie jede dieser Aktionen protokolliert haben. Die Sumo Logic Dashboards für diese Tools geben Ihnen Sichtbarkeit in Vorgänge, die leicht traditionelle Sicherheitskontrollen umgehen könnten.
Identitäts- und Zugriffsprotokolle über CloudTrail
Damit verfolgen Sie, wer einen Agenten aufgerufen, seine Konfiguration geändert, neue Tools hinzugefügt oder Berechtigungen angepasst hat. Governance und Compliance hängen davon ab.
Was Sie mit der Sumo Logic AgentCore App erfahren
Die App bietet Ihnen eine klare, kuratierte Sicht darauf, was bei der Überwachung agentischer Systeme am wichtigsten ist.
- Overview-Dashboard: Dieses zeigt Aufrufmuster, Fehlerraten, Latenzverteilungen sowie die wichtigsten Agenten und Tools. Hier erkennen Sie Verhaltensabweichungen oder frühe Anzeichen von Instabilität.
- Runtime-Dashboard: Hier finden Sie Aktivitäten auf Schritt-Ebene für jeden Agentenlauf, ähnlich wie APM-Traces. Es hilft Ihnen zu verstehen, wie ein Agent Aufgaben durchdenkt und wo Fehler auftreten.
- Gateway-Dashboard: Hier werden die Nutzung externer APIs und das Integrationsverhalten dargestellt. Dies ist entscheidend, um zu verstehen, wie Ihre Agenten mit dem Rest Ihrer Umgebung interagieren.
- Integrierte Tools-Dashboards: Diese verfolgen Browser- und Codeausführungsaktivitäten. Dies sind Ihre Ansichten für „Automatisierung mit hohem Risiko“.
- Identity-Dashboard: Es zeigt, wie Agenten aufgerufen und geändert werden. So können Teams unautorisierte Änderungen oder verdächtige Aufrufmuster erkennen.
Selbst wenn Sie AgentCore noch nicht verwenden, zeigt die Struktur dieser Dashboards die grundlegenden Anforderungen an die Observability jeder KI-Plattform.
Warum Logging bei KI wichtig ist
Agentische KI wird Dinge kaputt machen. Sie wird die Anweisungen falsch verstehen. Sie wird Aktionen mit hoher Zuversicht ausführen, die ein menschlicher Operator hinterfragen würde. Das ist die Realität von autonomen Systemen.
Das Problem ist nicht, dass Agenten gelegentlich Fehler machen. Das Problem entsteht, wenn sie Fehler in Umgebungen machen, in denen niemand hinsieht.
Logging ist der Weg, um Schutzmechanismen zu etablieren, Vorfälle zu erklären, Missbrauch zu erkennen, Governance durchzusetzen, Drift zu verfolgen, Verhalten zu optimieren und betriebliches Vertrauen in Systeme zu schaffen, die autonom handeln.
KI ohne Logs ist unkontrollierbar. KI mit Logs ist einfach ein weiterer Teil des Stacks.
Was Teams jetzt tun sollten
Sie benötigen keine große KI-Implementierung, um die richtige Observability-Strategie aufzubauen. Befolgen Sie diese Schritte, um mit der Überwachung Ihrer KI-Systeme zu beginnen.
- Aktivieren Sie Logging für Runtime-, Gateway-, Memory-, eingebaute Tools- und Identity-Ereignisse.
- Zentralisieren Sie diese Logs in Sumo Logic, damit Sie nicht über verstreute Log-Gruppen hinweg korrelieren müssen.
- Definieren Sie normales Verhalten als Basislinie. Diese Systeme verhalten sich anders als herkömmliche Dienste.
- Fügen Sie Alerts für verdächtige Muster hinzu, etwa wiederholte Gateway-Fehler, unerwartete Browser-Aktivität, neue Tool-Anbindungen oder ungewöhnliche Aufrufspitzen.
Behandeln Sie KI-Agenten wie privilegierte Servicekonten mit Automatisierungsfunktionen. Denn genau das sind sie.
Abschließender Gedanke
KI ist nicht von Natur aus sicher oder unsicher. Sie ist entweder beobachtbar oder nicht.
AgentCore bietet Teams eine strukturierte Möglichkeit, agentische KI zu nutzen, während Sumo Logic die Sichtbarkeit bereitstellt, um sie verantwortungsvoll zu betreiben. Wenn Sie Ihre Agenten instrumentieren wie Ihre Infrastruktur, erhalten Sie Zuverlässigkeit, Verantwortlichkeit und Vertrauen.
Wenn Sie es nicht tun, erhalten Sie eine Blackbox, die um 2 Uhr morgens Infrastruktur bereitstellen kann – ohne jede Spur.
Logging ist nicht optional. Sie ist die Grundlage für vertrauenswürdige KI-Operationen.

