Ergebnisse auf einen Blick
Herausforderung
Da die Protokolle schneller anwuchsen als die Budgets für die Einspeisung, musste das Unternehmen sicherstellen, dass keine Daten verlorengingen und alle zuverlässigen Analysen aufrechterhalten wurden.
Im Zuge der digitalen Transformation ist Automation Anywhere schnell gewachsen und hat neue Herausforderungen geschaffen. Während Automation Anywhere kontinuierlich neue Funktionen entwickelt, nutzen die Kunden ihre Lösungen in immer schnellerem Tempo. Dies führt zu einer explosiven Menge an Daten, die durch ihre Systeme fließen.
Für Automation Anywhere ist es von größter Bedeutung, die Transparenz und Zuverlässigkeit des gesamten Technologie-Stacks zu gewährleisten. Raj Desikavinayagompillai, US Cloud Operations Lead für Automation Anywhere, zufolge besteht die größte Herausforderung darin, sicherzustellen, dass alle Daten gesammelt und durchsuchbar sind. Die Ingest-Budgets wachsen jedoch nicht so schnell wie die Logs – eine Herausforderung für viele Unternehmen, die ein schnelles Wachstum erleben. Sie müssen ihre Ingest-Budgets einhalten und gleichzeitig sicherstellen, dass keine Daten verloren gehen und alle zuverlässigkeitskritischen Analysen aus den Daten gewonnen werden.
Laut Raj ist das Sammeln von Logs nur die Spitze des Eisbergs: „Logs sind für uns nichts anderes als Daten. Wir wollen mehr aus den Daten herausholen.“ Automation Anywhere benötigte eine kosteneffiziente Lösung zur Skalierung der Cloud-Beobachtbarkeits-Infrastruktur des Unternehmens, die es ihm ermöglicht, alle Logs zu sammeln und sie für ihre Teams nützlich und verwertbar zu machen.
Lösung
Automation Anywhere entschied sich für Sumo Logic als strategischen Partner für Observability, um die Erfassung aller Logdaten sowie die Gewinnung verwertbarer Erkenntnisse sicherzustellen und gleichzeitig das Budget einzuhalten.
Sumo Logic hat Automation Anywhere geholfen, seine Effizienz drastisch zu steigern. Das mehrstufige Preismodell ermöglicht es Automation Anywhere, alle Logs zu sammeln, wenn die Anforderungen an die Datenerfassung steigen. Dashboarding- und Warnfunktionen ermöglichen es Automation Anywhere, Workflows zu erstellen, die den Zeitaufwand für die Analyse von ganzen Tagen auf weniger als 30 Minuten reduziert haben.
Darüber hinaus stellt Sumo Logic Automation Anywhere das erforderliche Toolkit zur Verfügung, um seine Workflows weiterzuentwickeln und zu verfeinern und dadurch die manuellen Engineering-Aufgaben zu reduzieren, insbesondere dank der automatischen Korrektur mit der Integration von Shoreline und Sumo Logic. Andere wichtige Tools, die in dieser Lösung verwendet werden, sind Atlassian Opsgenie und Jira.

„Jede Minute, die wir vergeuden, ist Zeit, die wir sparen könnten, um Vorfälle schnell zu beheben.“
– Raj Desikavinayagompillai, Leiter US Cloud Operations
Ergebnisse
Da Raj seit mehr als zwei Jahrzehnten in der Branche tätig ist, ist er mit den auf dem Markt verfügbaren Lösungen bestens vertraut. In seinem vorherigen Unternehmen arbeitete er mit Splunk. Jetzt bei Automation Anywhere ist er der führende Sumo-Logic-Botschafter und treibt die strategische Partnerschaft voran.
Automation Anywhere arbeitet kontinuierlich mit Sumo Logic zusammen, um die Entwicklungszeit zu verkürzen, indem wir nach Wegen suchen, um die Funktionen sowie Integrationsmöglichkeiten von Sumo Logic zu nutzen und Workflows zu erstellen, die die Überwachung vereinfachen und die Zuverlässigkeit gewährleisten.
Kostengünstige, skalierbare Dateneinspeisung und -überwachung dank einer mehrstufigen Preisgestaltung
Automation Anywhere nutzt die Preisstufen Continuous und Infrequent von Sumo Logic, um sicherzustellen, dass alle Logs erfasst und überwacht werden, ohne dass das Budget für die Erfassung überschritten wird. Derzeit nutzt das Unternehmen Sumo Logic, um Daten für seine gesamte Cloud-Umgebung auf AWS und GCP einzuspeisen und zu überwachen – von der Warteschlange, dem Relational Database Service (RDS), dem Frontend und den Anwendungsstacks.
Mithilfe der zeitgesteuerten Suchfunktion von Sumo Logic mit benutzerdefinierter Logik, die für ein-, zwei- und siebentägige Trends für jede Ebene auf der Collector-Ebene eingerichtet wurde, kann das Automation Anywhere-Team sein gesamtes System überwachen und wird bei allen Musteränderungen, die behoben werden müssen, benachrichtigt.

Verwendete Datenebenen
- Die Preisstufe „Continuous Tier“ ist für die Daten bestimmt, die zur Überwachung und Fehlerbehebung von Produktionsanwendungen sowie zur Gewährleistung der Sicherheit von Anwendungen verwendet werden.
- Die Preisstufe „Infrequent“ ist für Daten gedacht, die zur Fehlersuche bei intermittierenden oder schwer zu reproduzierenden Problemen verwendet werden. Zum Beispiel Debugging-Logs, Betriebssystemprotokolle, Thread-Dumps usw. Bei der Infrequent-Stufe wird pro Suche bezahlt und die Ingestionskosten sind niedrig.
Reduzierung der Zeit für die Analyse von höheren Protokollaufkommen von ganzen Tagen auf 30 Minuten
Eine Veränderung des Musters, wie etwa ein höheres Protokollaufkommen, löst einen Opsgenie-Alarm aus, der dann ein JIRA-Ticket erstellt. Automation Anywhere nutzt die Dashboards von Sumo Logic, um Logdaten in Buckets auf der Basis von Kubernetes-Clustern zu gruppieren. So kann sich das Unternehmen bei der Reaktion auf Warnmeldungen auf kleinere Pools von Logs konzentrieren und die mittlere Zeit bis zur Reparatur (MTTR) – von der Triagierung über die Analyse bis hin zur Fehlerbehebung – von vormals ganzen Tagen auf etwa 30 Minuten reduzieren.
Für ein Unternehmen mit einer massiven globalen Präsenz von etwa vierzehn Rechenzentren bedeutet die Zeitersparnis bei der Durchsicht von Logs durch die Kategorisierung in kleinere Stapel eine schnellere Analyse und Zeit zum Handeln. „Jede Minute, die wir verschwenden, ist Zeit, die wir sparen können, um Vorfälle schnell zu beheben“, erklärt Raj. Hier ein Beispiel für ein JIRA-Ticket, das durch diesen Workflow ausgelöst wird und von einem Analysten auf Abruf in Echtzeit behoben wird.

Automatisierte Zuverlässigkeitsüberwachung und Problemlösung durch Sumo Logic und Shoreline-Integration
Sumo Logic stellt sicher, dass alle Logdaten überwacht werden, und alles, was über die festgelegten Schwellenwerte hinausgeht, löst einen Alarm aus. Von dort aus steuert die Shoreline-Integration einen selbstheilenden Workflow, der Runbooks, die bereits in Op Packs bereitgestellt wurden, verwendet und automatisch Schnellkorrekturen für bekannte Vorfälle anwendet.
Dieser Workflow hat die MTTR für bekannte Vorfälle verkürzt, indem er die ein bis drei manuellen Maßnahmen eliminiert hat, die die CloudOps-Analysten auf Abruf jeden Tag durchführen müssen. Das spart ca. 15–45 Minuten an Arbeitszeit, die zuvor für das manuelle Durchgehen der Runbooks für Vorfälle und die Anwendung von Korrekturen aufgewendet wurde. Der Produktivitätsverlust, der durch Unterbrechungen und Aufgabenwechsel entsteht, ist dabei noch nicht berücksichtigt.
Dies ist besonders wichtig, wenn Probleme auf Clusterebene auftreten. Wenn die Datenaufnahme unterbrochen wird, wird die Problemlösung zusätzlich erschwert und verlangsamt, da nicht nur ein Fehler identifiziert werden muss, sondern auch eine Lücke im Fluss der Echtzeitdaten entsteht, die zur Überwachung und Fehlerbehebung von Clustern erforderlich sind. Automatische Aktionen und automatische Korrekturen mit Sumo Logic und Shoreline verringern den Zeitaufwand und den Datenverlust bei diesen Vorfällen. Automation Anywhere beabsichtigt, diese Integration in Zukunft weiter auszubauen.