Ergebnisse auf einen Blick
Herausforderung
Da die Protokolle schneller anwuchsen als die Budgets für die Einspeisung, musste das Unternehmen sicherstellen, dass keine Daten verlorengingen und alle zuverlässigen Analysen aufrechterhalten wurden.
Im Zuge der digitalen Transformation ist Automation Anywhere schnell gewachsen und auf neue Herausforderungen gestoßen. Während die Ingenieure von Automation Anywhere kontinuierlich neue Funktionen entwickeln, nutzen die Kunden die Lösungen des Unternehmens in einem immer schnelleren Tempo. Dies führt zu einer explosiven Menge an Daten, die durch die Unternehmessysteme fließen.
Für Automation Anywhere ist es von höchster Bedeutung, die Beobachtbarkeit und Zuverlässigkeit des gesamten Technikpakets zu gewährleisten. Raj Desikavinayagompillai, Leiter US Cloud Operations bei Automation Anywhere, teilt mit, dass die größte Herausforderung darin besteht, sicherzustellen, dass alle Daten gesammelt und durchsuchbar sind. Allerdings wachsen die Budgets für die Einspeisung nicht so schnell wie die Protokollmengen – eine Herausforderung für viele Unternehmen, die ein schnelles Wachstum erfahren. Sie müssen ihre Budgets für die Einspeisung einhalten und gleichzeitig sicherstellen, dass keine Daten verlorengehen und alle zuverlässigkeitsrelevanten Analysen aus den Daten gewonnen werden.
Laut Raj ist das Sammeln von Protokollen nur die Spitze des Eisbergs: „Protokolle sind für uns nichts anderes als Daten. Wir wollen mehr aus den Daten herausholen.“ Automation Anywhere benötigte eine kosteneffiziente Lösung zur Skalierung der Cloud-Beobachtbarkeits-Infrastruktur des Unternehmens, die es ihm ermöglicht, alle Protokolle zu sammeln und sie für ihre Teams nützlich und verwertbar zu machen.
Lösung
Automation Anywhere entschied sich für Sumo Logic als strategischen Partner für die Beobachtbarkeit, um die Erfassung aller Protokolldaten sowie die Gewinnung verwertbarer Erkenntnisse sicherzustellen und gleichzeitig das Budget einzuhalten.
Sumo Logic hat Automation Anywhere geholfen, seine Effizienz drastisch zu steigern. Der Data Tier-Tarif ermöglicht es Automation Anywhere, alle Protokolle zu sammeln, wenn die Anforderungen an die Datenaufnahme steigen. Mit den Dashboarding- und Warnmeldungsfunktionen kann Automation Anywhere Workflows erstellen, die den Zeitaufwand für die Analyse von mehreren Tagen auf weniger als 30 Minuten reduziert haben.
Darüber hinaus stellt Sumo Logic Automation Anywhere das erforderliche Toolkit zur Verfügung, um seine Workflows weiterzuentwickeln und zu verfeinern und dadurch die manuellen Engineering-Aufgaben zu reduzieren, insbesondere dank der automatischen Korrektur mit der Integration von Shoreline und Sumo Logic. Andere wichtige Tools, die in dieser Lösung verwendet werden, sind Atlassian Opsgenie und Jira.

„Jede Minute, die wir vergeuden, ist Zeit, die wir sparen könnten, um Vorfälle schnell zu beheben.“
– Raj Desikavinayagompillai, Leiter US Cloud Operations
Ergebnisse
Da Raj seit über zwei Jahrzehnten in der Branche tätig ist, kennt er sich mit den auf dem Markt verfügbaren Lösungen bestens aus. In seinem vorherigen Unternehmen hat er mit Splunk gearbeitet. Jetzt ist er bei Automation Anywhere der führende Evangelist von Sumo Logic, der die strategische Partnerschaft ausbaut.
Die Ingenieure von Automation Anywhere arbeiten kontinuierlich mit Sumo Logic zusammen, um die Entwicklungszeit zu verkürzen, indem sie nach Wegen suchen, um die Funktionen sowie Integrationsmöglichkeiten von Sumo Logic zu nutzen und Workflows zu erstellen, die die Überwachung vereinfachen und die Zuverlässigkeit gewährleisten.
Kostengünstige, skalierbare Dateneinspeisung und -überwachung dank einer mehrstufigen Preisgestaltung
Automation Anywhere nutzt die Preisstufen „Continuous“ und „Infrequent“ von Sumo Logic, um sicherzustellen, dass alle Protokolle erfasst und überwacht werden, ohne dass das Budget für die Erfassung überschritten wird. Das Unternehmen verwendet derzeit Sumo Logic, um Daten für die gesamte Cloud-Umgebung auf AWS und GCP einzuspeisen und zu überwachen – aus der Warteschlange, dem Relational Database Service (RDS), dem Frontend und den Anwendungsstacks.
Mithilfe der zeitgesteuerten Suchfunktion von Sumo Logic mit benutzerdefinierter Logik, die für ein-, zwei- und siebentägige Trends für jede Ebene auf der Collector-Ebene eingerichtet wurde, kann das Automation Anywhere-Team sein gesamtes System überwachen und wird bei allen Musteränderungen, die behoben werden müssen, benachrichtigt.

Verwendete Datenebenen
- Die „Continuous Tier“ ist für die Daten bestimmt, die zur Überwachung und Fehlerbehebung von Produktionsanwendungen sowie zur Gewährleistung der Sicherheit von Anwendungen verwendet werden.
- Die „Infrequent Tier“ ist für Daten gedacht, die zur Fehlersuche bei intermittierenden oder schwer reproduzierbaren Problemen verwendet werden. Zum Beispiel Debugging-Protokolle, Betriebssystem-Protokolle, Thread-Dumps, usw. Die Infrequent-Ebene hat ein Preismodell, bei dem pro Suche bezahlt wird, und niedrige Einspeisungskosten.
Reduzierung der Zeit für die Analyse von höheren Protokollaufkommen von Tagen auf 30 Minuten
Eine Veränderung des Musters, wie etwa ein höheres Protokollaufkommen, löst einen Opsgenie-Alarm aus, der dann ein JIRA-Ticket erstellt. Automation Anywhere nutzt die Dashboards von Sumo Logic, um Protokolldaten in Buckets auf der Basis von Kubernetes-Clustern zu gruppieren. So kann sich das Unternehmen bei der Reaktion auf Warnmeldungen auf kleinere Pools von Protokollen konzentrieren und die mittlere Zeit bis zur Reparatur (MTTR) – von der Triagierung über die Analyse bis hin zur Fehlerbehebung – von vormals mehreren Tagen auf etwa 30 Minuten reduzieren.
Für ein Unternehmen mit einer massiven globalen Präsenz von etwa vierzehn Rechenzentren bedeutet die Kategorisierung der Protokolle in kleinere Stapel eine schnellere Analyse und Reaktionszeit. „Jede Minute, die wir vergeuden, ist Zeit, die wir sparen könnten, um Vorfälle schnell zu beheben.“, sagt Raj. Hier ein Beispiel für ein JIRA-Ticket, das von diesem Workflow ausgelöst und von einem Bereitschaftsingenieur in Echtzeit behoben wird.

Automatisierte Zuverlässigkeitsüberwachung und Problemlösung durch Sumo Logic und Shoreline-Integration
Sumo Logic stellt sicher, dass alle Protokolldaten überwacht werden, und alles, was über die festgelegten Schwellenwerte hinausgeht, löst einen Alarm aus. Von dort aus steuert die Shoreline-Integration einen selbstheilenden Workflow, der Runbooks, die bereits in Op Packs bereitgestellt wurden, verwendet und automatisch Schnellkorrekturen für bekannte Vorfälle anwendet.
Dieser Workflow hat die MTTR für bekannte Vorfälle verbessert, indem er die ein bis drei manuellen Maßnahmen eliminiert hat, die die CloudOps-Techniker auf Abruf jeden Tag durchführen müssen. Das spart ca. 15–45 Minuten an Technikerzeit, die zuvor für das manuelle Durchgehen der Runbooks für Vorfälle und die Anwendung von Korrekturen aufgewendet wurde. Der Produktivitätsverlust, der durch Unterbrechungen und Aufgabenwechsel entsteht, ist dabei noch nicht berücksichtigt.
Dies ist besonders wichtig, wenn Probleme auf Cluster-Ebene auftreten. Wenn die Datenaufnahme unterbrochen wird, wird die Problemlösung zusätzlich erschwert und verlangsamt, da nicht nur ein Fehler identifiziert werden muss, sondern auch eine Lücke im Fluss der Echtzeitdaten entsteht, die zur Überwachung und Fehlerbehebung von Clustern erforderlich sind. Automatische Aktionen und Korrekturen mit Sumo Logic und Shoreline reduzieren den Zeitaufwand sowie den Datenverlust bei diesen Vorfällen. Automation Anywhere beabsichtigt, diese Integration in Zukunft noch weiter auszubauen.