Wenn Zeit Geld ist: Wie SLOs die Plattformleistung für eine genaue Zeiterfassung optimieren
Ergebnisse auf einen Blick
Herausforderung
Bei zu vielen Überwachungsanbietern hatte Laurel zahlreiche blinde Flecken und konnte nicht feststellen, ob sie die Kundenversprechen einhielten.
Laurel hat es sich zur Aufgabe gemacht, seine Kunden bei der Automatisierung von Zeiterfassungs- und Abrechnungsprozessen zu unterstützen. Die meisten Anwälte verwenden ausschließlich Microsoft-Produkte und interagieren daher hauptsächlich über die Windows-Desktop-Anwendung mit dem System von Laurel.
Neun externe Anbieter überwachten die Systeme von Laurel, was die Zuverlässigkeit der Desktop-Anwendung und der Infrastrukturarchitektur pro Kunde zu einer Herausforderung machte.
Selbst mit dieser Reihe von Lösungen gab es viele Schwachstellen in Bezug auf die Zuverlässigkeit – man wusste nicht, ob man die Erwartungen der Kunden hinsichtlich eines effizienten Zeitmanagements erfüllte. Da die Container nur Alarme für CPU und Speicher enthielten, wurden viele schlecht angereicherte Alarme ignoriert. Ihr Bereitschaftsdienst war unorganisiert und bestand aus Leuten, die nicht mehr im Unternehmen waren.
Die Produkt- und Entwicklungsteams von Laurel haben ihre aktuellen Arbeitsabläufe unter die Lupe genommen – und festgestellt, dass sie unzureichend sind. Sie mussten ihre allgemeine Herangehensweise und ihr Verständnis von Infrastrukturüberwachung korrigieren und dabei das Wohlbefinden ihrer Ingenieure durch mehr Klarheit und weniger Stress verbessern.
Laurel führte eine Ausschreibung (RFP) mit neun Anbietern durch und suchte nach einer Überwachungslösung, die einen breiteren Überblick bietet. Die Produkt- und Technikteams von Laurel entschieden sich außerdem für einen SLO-Ansatz (Service Level Objective) in Bezug auf die Zuverlässigkeit und machten sich auf die Suche nach Lösungen, die diesem Ansatz entsprachen.
„Wir haben Warnmeldungen, wir haben Messdaten, wir haben Traces, wir haben Protokolle, aber wir wissen nicht wirklich, ob unsere Kunden mit unserem Produkt zufrieden sind. Das ist frustrierend und nicht wirklich das Gespräch, das ich mit unserer Führungsebene führen möchte“, sagte Nat Welch, Lead Cloud Platform Engineer bei Laurel.
Lösung
Letztlich hatte Laurel zwei Ziele:
- Sicherzustellen, dass die Kunden mit ihrem Angebot zufrieden sind und sich auf ihr Produkt verlassen können.
- Für die psychische Gesundheit der Mitarbeiter von Laurel zu sorgen, indem sie ihre Zeit auf hochwertige Aufgaben konzentrieren
Laurel hat sich für Sumo Logic als Überwachungsplattform entschieden. Sumo Logic arbeitete nahtlos mit den anderen Tools zusammen, die sie in ihre neuen Arbeitsabläufe integriert haben, wie OpsGenie für ihre Bereitschaftsrotation und OpenTelemetry zur Vereinfachung und Erweiterung der Erfassung.

„Wir möchten unseren Kunden ein gutes Produkt bieten, aber auch die psychische Gesundheit unserer Ingenieure verbessern, während sie unser Produkt bauen.“
– Nat Welch, Lead Cloud Platform Engineer, Laurel
Ergebnisse
Sind unsere Kunden zufrieden? Das ist die Frage, die Laurels Ingenieure beantworten und der Geschäftsleitung selbstbewusst mitteilen können müssen.
Operationalisierung von SRE-Praktiken und App-Zuverlässigkeit durch SLOs
Das technische Team von Laurel benötigte einen tieferen Einblick in das Kundenerlebnis, der über die Basisüberwachung durch die Standard-Dashboards hinausging. Das Team definierte und verfolgte SLOs mit der Reliability Management-Lösung von Sumo Logic.
Zuverlässigkeit, wie sie in SLOs formalisiert ist, hilft den Technikern, sich auf die Überwachung und Fehlerbehebung der Benutzererfahrung zu konzentrieren, indem sie messen, was für die Endbenutzer wichtig ist, und gleichzeitig potenziell bedeutungslose Alarme und falsche Eskalationen reduzieren.
Das Laurel-Team begann mit zwei SLOs – Anforderungslatenz und API-Erfolg –, um die Haupt-API für ihren Service-Endpunkt zu überwachen und dabei Kundenumgebungen und gemeinsam genutzte Dienste abzudecken.


Mit der automatisierten SLO-Überwachung kann Laurel beim Start neuer Dienste in seiner Anwendung ganz einfach generische SLOs erstellen, um die Benutzererfahrung anhand der bereits in Sumo Logic erfassten Daten zu verfolgen. Das Gleiche gilt, wenn sie neue Kunden an Bord nehmen.

Das SLO-Dashboard in der Sumo Logic-Benutzeroberfläche bietet eine aktive Ansicht des Zustands und des Status der Dienste, die Laurel überwacht.
Das SLO-Dashboard zeigt Folgendes an:
- Service-Level-Indikatoren (SLIs): Quantitative Angaben (in der Regel in Prozent) zur System- oder Serviceverfügbarkeit innerhalb des festgelegten Erfüllungszeitraums.
- Verbleibendes Fehlerbudget: Basierend auf dem SLO ist dies die verbleibende Anzahl von Fehlern, die auftreten können, ohne dass die Vorschriften verletzt werden.
- Fehlerverlauf: Eine Möglichkeit, Fehler zu verfolgen und zu sehen, wie schnell sie behoben werden, um unnötige Warnungen zu vermeiden.

„Bei unserer vorherigen Alarmierung hätte wahrscheinlich jeder Fehler einen Alarm ausgelöst und jemanden aufgeweckt oder bei der Arbeit unterbrochen. Und da wir nur 50 Ingenieure haben, ist das nicht so toll. Davon entfernen wir uns.“
– Nat Welch, Lead Cloud Platform Engineer, Laurel
Nahtlose Nutzung und Zugriff auf Daten mit Toolkonsolidierung
Da Laurel Sumo Logic als Überwachungslösung einsetzt, müssen die Daten nicht zu anderen Überwachungs-Tools migriert werden. Die Daten werden gemeinsam genutzt und sind für alle Funktionen zugänglich, wodurch Schritte im SLO-Überwachungsprozess entfallen. Laurel kann die von Sumo Logic exportierten Rohdaten auch in benutzerdefinierten Dashboards verwenden.

„Die SLO-Lösung von Sumo Logic nutzte vorhandene Daten. Einer der Hauptgründe, warum wir keinen neuen Kunden anlegen wollten, war, dass wir eine Art Leitung hätten einrichten müssen, um die Daten zu übertragen.“
– Nat Welch, Lead Cloud Platform Engineer, Laurel
Innovationen für mehr Produktivität
Das Produktteam von Sumo Logic hat Terraform-Unterstützung hinzugefügt, um die SLO-Einrichtung und -Überwachung von Laurel zu optimieren. Dank dieser Integration brauchte das Laurel-Team nur 90 Zeilen Code zu schreiben, um die wenigen hundert SLOs zu erstellen, die es für seine Kunden benötigte.
„Einige der Probleme, die wir mit einigen unserer früheren Überwachungsunternehmen hatten, bestanden darin, dass sie ihre Produkte über mehrere Jahre hinweg nicht verändert hatten. Sumo Logic war ständig innovativ und hatte außerdem eine vernünftige Preisstruktur, was für uns als Start-up wichtig ist“, sagte Welch.