Wenn Zeit Geld ist: Wie SLOs die Plattformleistung für eine präzise Zeiterfassung optimieren
Ergebnisse auf einen Blick
Herausforderung
Bei zu vielen Überwachungsanbietern hatte Laurel zahlreiche blinde Flecken und konnte nicht feststellen, ob sie die Kundenversprechen einhielten.
Laurel hat es sich zur Aufgabe gemacht, seine Kunden bei der Automatisierung von Zeiterfassungs- und Abrechnungsprozessen zu unterstützen. Da die meisten Anwälte ausschließlich Microsoft-Produkte verwenden, interagieren sie mit dem System von Laurel hauptsächlich über die Windows-Desktop-Anwendung.
Neun externe Anbieter überwachten die Systeme von Laurel, was die Zuverlässigkeit der Desktop-Anwendung und der kundenspezifischen Infrastrukturarchitektur zu einer Herausforderung machte.
Trotz dieser Vielzahl an Lösungen gab es viele blinde Flecken bei der Zuverlässigkeit – man wusste nicht, ob man die Erwartungen der Kunden an ein effizientes Zeitmanagement erfüllte. Da es lediglich Alarme für die CPU- und Speicherauslastung ihrer Container gab, wurden viele wenig aussagekräftige Warnmeldungen schlichtweg ignoriert. Zudem war die Rufbereitschaft ungeordnet und umfasste sogar Personen, die gar nicht mehr im Unternehmen waren.
Die Produkt- und Engineering-Teams von Laurel unterzogen ihre aktuellen Arbeitsabläufe einer kritischen Prüfung – und stellten fest, dass diese unzureichend waren. Sie mussten ihren grundlegenden Ansatz und ihr Verständnis der Infrastrukturüberwachung korrigieren und dabei gleichzeitig das Wohlbefinden ihrer Techniker durch mehr Klarheit und weniger Stress verbessern.
Laurel führte eine Ausschreibung (RFP) mit neun Anbietern durch, um eine Monitoring-Lösung zu finden, die eine umfassendere Transparenz bietet. Die Produkt- und Engineering-Teams von Laurel entschieden sich zudem für einen SLO-Ansatz (Service Level Objective) in Bezug auf die Zuverlässigkeit und machten sich gezielt auf die Suche nach Lösungen, die darauf ausgerichtet waren.
„Wir haben Alerts, wir haben Kennzahlen, wir haben Traces, wir haben Logs – aber wir wissen nicht wirklich, ob unsere Kunden mit unserem Produkt zufrieden sind. Das ist frustrierend und nicht gerade das Gespräch, das ich mit unserer Geschäftsführung führen möchte“, sagt Nat Welch, Lead Cloud Platform Engineer bei Laurel.
Lösung
Letztlich hatte Laurel zwei Ziele:
- sicherstellen, dass die Kunden mit ihrem Angebot zufrieden sind und sich auf ihr Produkt verlassen können.
- für die psychische Gesundheit der Mitarbeiter von Laurel sorgen, indem sie ihre Zeit auf hochwertige Aufgaben konzentrieren
Laurel wählte Sumo Logic als seine Überwachungsplattform. Sumo Logic arbeitete nahtlos mit den anderen Tools zusammen, die in die neuen Arbeitsabläufe integriert wurden, wie z. B. OpsGenie für den Bereitschaftsdienst und OpenTelemetry zur Vereinfachung und Erweiterung der Erfassung.

„Wir möchten unseren Kunden ein gutes Produkt bieten, aber auch die psychische Gesundheit unserer Techniker fördern, während sie unser Produkt entwickeln.“
– Nat Welch, Lead Cloud Platform Engineer, Laurel
Ergebnisse
Sind unsere Kunden zufrieden? Das war die Frage, die Laurels Techniker beantworten und der Geschäftsführung gegenüber souverän kommunizieren mussten.
Operationalisierung von SRE-Praktiken und App-Zuverlässigkeit durch SLOs
Das Engineering-Team von Laurel benötigte tiefere Einblicke in die Kundenerfahrung, die über das einfache Monitoring durch Standard-Dashboards hinausgingen. Mithilfe der Reliability-Management-Lösung von Sumo Logic definierte und überwachte das Team daraufhin entsprechende SLOs.
Zuverlässigkeit, wie sie in SLOs formalisiert ist, hilft den Technikern, sich auf die Überwachung und Fehlerbehebung der Benutzererfahrung zu konzentrieren, indem sie messen, was für die Endbenutzer wichtig ist, und gleichzeitig potenziell bedeutungslose Alarme und falsche Eskalationen reduzieren.
Das Laurel-Team begann mit zwei SLOs – Anforderungslatenz und API-Erfolg –, um die Haupt-API für ihren Service-Endpunkt zu überwachen und dabei Kundenumgebungen und gemeinsam genutzte Dienste abzudecken.


Mit der automatisierten SLO-Überwachung kann Laurel beim Start neuer Dienste in seiner Anwendung einfach generische SLOs erstellen, um die Benutzererfahrung mit den bereits in Sumo Logic erfassten Daten zu verfolgen. Dasselbe gilt beim Onboarding neuer Kunden.

Das SLO-Dashboard in der Sumo Logic-Benutzeroberfläche bietet einen aktiven Überblick über den Zustand und den Status der von Laurel überwachten Dienste.
Das SLO-Dashboard zeigt Folgendes an:
- Service-Level-Indikatoren (SLIs): Quantitative Messwerte (in der Regel in Prozent) für die System- oder Serviceverfügbarkeit innerhalb des festgelegten Erfüllungszeitraums.
- Verbleibendes Fehlerbudget: Basierend auf dem SLO ist dies die Restmenge an Fehlern, die auftreten darf, um die Compliance-Vorgaben weiterhin zu erfüllen.
- Fehlerverlauf: Eine Möglichkeit, Fehler zu verfolgen und zu sehen, wie schnell sie behoben werden, um unnötige Warnungen zu vermeiden.

„Bei unserem vorherigen Alarmsystem hätte wahrscheinlich jeder Fehler einen Alarm ausgelöst und jemanden aufgeweckt oder bei der Arbeit unterbrochen. Und da wir nur 50 Techniker haben, ist das nicht so toll. Davon kommen wir jetzt weg.“
– Nat Welch, Lead Cloud Platform Engineer, Laurel
Nahtlose Nutzung und Zugriff auf Daten mit Tool-Konsolidierung
Da Laurel Sumo Logic als Observability-Lösung nutzt, ist eine Datenmigration in andere Monitoring-Tools nicht erforderlich. Die Daten werden zwischen den verschiedenen Funktionen geteilt und sind überall zugänglich, was zusätzliche Schritte im SLO-Monitoring-Prozess überflüssig macht. Zudem kann Laurel die aus Sumo Logic exportierten Rohdaten in benutzerdefinierten Dashboards verwenden.

„Die SLO-Lösung von Sumo Logic nutzte bereits vorhandene Daten. Einer der Hauptgründe, warum wir keinen neuen Kunden einführen wollten, war, dass wir erst eine Art Pipeline hätten aufbauen müssen, um die Daten dorthin zu übertragen.“
– Nat Welch, Lead Cloud Platform Engineer, Laurel
Innovationen für mehr Produktivität
Das Produktteam von Sumo Logic hat Terraform-Unterstützung hinzugefügt, um die Einrichtung und Überwachung der SLOs bei Laurel zu rationalisieren. Dank dieser Integration musste das Team von Laurel nur 90 Zeilen Code schreiben, um die paar hundert SLOs zu erstellen, die für ihren Kundenstamm benötigt wurden.
„Einige der Probleme, die wir mit unseren alten Monitoring-Anbietern hatten, resultierten daraus, dass sie ihr Produkt über mehrere Jahre hinweg nicht verändert hatten. Sumo Logic hingegen hat ständig Innovationen vorangetrieben und verfügte zudem über eine faire Preisstruktur, was für uns als Startup besonders wichtig ist“, so Welch.