Ergebnisse auf einen Blick
Herausforderung
Die ausufernden Tools, die Acquia in den Jahren des schnellen Wachstums entwickelt hatte, verdoppelten den Arbeitsaufwand und schränkten die End-to-End-Transparenz ein.
Aufgrund des jahrelangen schnellen Wachstums hat sich das Portfolio von Acquia auf eine breite Palette von Plattformen, Komponenten und Systemen erweitert, die alle Telemetriedaten melden. Die Erfassung dieser Telemetriedaten war für Acquia wichtig, um die Leistung der gesamten verteilten Landschaft zu bewerten. Daher entschied sich das Unternehmen für Sumo Logic zur Protokollüberwachung sowie einen anderen Anbieter für die Überwachung von Warnmeldungen und Ereignissen.
Dieses Vorgehen brachte jedoch Herausforderungen mit sich. Die Nutzung von zwei Anbietern für Telemetrie verdoppelte die Arbeit. Die Nutzer mussten sich in zwei Systeme einarbeiten und diese navigieren. Zusätzlich führte das Tool-Chaos dazu, dass dem Unternehmen eine vollständige Übersicht fehlte, da es keine Möglichkeit gab, Logs, Metriken und Ereignisse an einem einzigen Ort zusammenzuführen.
Lösung
Um die Effizienz zu steigern und eine ganzheitliche Sicht auf ihre vielen Anwendungsfälle zu erhalten, entschied sich Acquia, die Tools zu konsolidieren und auf einer einzigen Observability-Plattform zu zentralisieren. Sie prüften alle Optionen, einschließlich der Möglichkeit eines „Build versus Buy“-Ansatzes. Nach Abschluss dieser umfassenden Bewertung stellte Acquia fest, dass Sumo Logic die Kriterien besser erfüllte als alle anderen in Betracht gezogenen Alternativen.
Am Ende des Bewertungszeitraums kristallisierte sich Sumo Logic als der Partner der Wahl heraus. Als der Vertrag unterzeichnet wurde, blieben nur noch sechs Monate Zeit, um alle Telemetriedaten zu konsolidieren. Da es sich um ein Tier-One-Projekt mit vielen Abhängigkeiten handelte, arbeiteten viele verschiedene Teams zusammen, um die Migration mit Höchstgeschwindigkeit durchzuführen.
„Mehr als 25 Acquia-Teams und acht Sumo Logic-Engineering-Teams arbeiteten direkt miteinander zusammen, Ingenieure arbeiteten mit Ingenieuren. Sumo Logic hat alles gegeben und in diesem Zeitraum über 50 Funktionen geliefert. Und natürlich haben sie auch nach der Migration weiterhin Funktionen geliefert, um unsere Anforderungen zu erfüllen. Am Ende wurde die Konsolidierung pünktlich und unter Budget erreicht“, erzählt Farnoosh Azadi, Director of Engineering bei Acquia.

„Sumo hat alle Register gezogen und über 50 Funktionen in diesem Zeitrahmen geliefert. Das Endergebnis war, dass die Konsolidierung pünktlich und unter dem Budget erreicht wurde.“
– Farnoosh Azadi, Director of Engineering
Ergebnisse
Höhere Effizienz und Benutzerakzeptanz
Mit einfachen und intuitiven Integrationen hat Acquia schnell Logs aus umfangreichen Quellen aufgenommen – von benutzerseitigen Anwendungen wie PagerDuty und Slack bis hin zu Logs der verschiedenen Produkte und Software des Unternehmens, die rein für Infrastrukturzwecke entwickelt wurden, darunter Kubernetes, Varnish, php, MySQL, Apache und andere.
Da das Unternehmen jetzt nur noch die Integrationen von Drittanbietern für eine einzige Telemetrieplattform verwaltet, hat Acquia Nachbearbeitungszyklen eliminiert und eine größere Effizienz erreicht. „Es gibt keine doppelten Integrationen oder Kompatibilitätsprobleme. Alle unsere internen Benutzer können sich jetzt darauf konzentrieren, ihr Fachwissen über Sumo Logic auszubauen, so dass alles ganz einfach ist und unsere Akzeptanz weit verbreitet ist“, sagt Azadi.
Befähigung von technischen und nicht-technischen Teams gleichermaßen
Die Cloud-native Plattform von Sumo Logic hat Struktur, Klarheit und End-to-End-Transparenz für Acquias weitreichende Beobachtungsanforderungen geschaffen. Mit den leistungsstarken Datenanalysen von Sumo Logic, die auf Logs basieren, kann Acquia die Leistung der gesamten verteilten Landschaft auswerten, um auf der Grundlage von Beobachtbarkeits- und Infrastrukturüberwachungsdaten Geschäftsprognosen zu erstellen.
Neben dem Team, das die Telemetrie nutzt, um den Zustand und die Leistung der Produktionssysteme zu verwalten, verlassen sich zahlreiche Gruppen im gesamten Unternehmen auf die Plattform für ihren täglichen Betrieb. Beispielsweise sammeln die Front-End-Teams Daten von Websites und Systemen mit Kundenkontakt, um das Kundenerlebnis und den Zustand der wichtigsten Benutzeroberflächen innerhalb der Acquia Cloud und anderer Produkte zu verfolgen.
Teams bei Acquia verlassen sich auf die Dashboards und die umfangreiche Abfragesprache von Sumo Logic, um aggregierte Daten zu filtern, zu analysieren und zu manipulieren und so wertvolle Erkenntnisse zu gewinnen. Die Observability-Plattform ist so einfach zu bedienen, dass technische und nicht-technische Teams eigene Dashboards für ihre geschäftlichen Anforderungen erstellt haben. Die Quality Engineering (QE)-Teams setzen auf eine Reihe von Dashboards, um Testergebnisse zu verfolgen und darüber zu berichten; Kundenbetreuer verwenden Dashboards, um ein Auge auf die Kundensysteme zu haben und diese zu überprüfen; und die Support-Teams verwenden Telemetrie und Dashboards, um die Reaktion auf Vorfälle zu verwalten und die Zustandsdiagnose zu überwachen, um den Kunden eine hochwertige Erfahrung zu bieten.
Echtzeit-Einblicke in großem Maßstab
Als Teil seiner Qualitätsverpflichtung bietet Acquia seinen Kunden eine Service-Level-Vereinbarung mit einer Betriebszeit von 99,95 %. Die Einhaltung dieser Verpflichtung erfordert Echtzeitinformationen von Sumo Logic über den Zustand und die Leistung der Infrastruktur, auf der die Kundenprodukte laufen.
Um ein kontinuierliches Bild der Infrastruktur zu erhalten, sammelt Sumo Logic Telemetriedaten von mehr als 20.000 geografisch verteilten EC2-Servern, Tausenden von Kubernetes-Pods sowie einer breiten Palette von Logs aus einer Mischung anderer Erfassungsmechanismen. Da die Infrastrukturdaten in großem Umfang in Echtzeit erfasst und wiedergegeben werden, erkennen die Experten von Acquia alle Frühwarnindikatoren und können diese schnell beheben, bevor sie eskalieren.