Preise Anmelden Kostenlos testen Support
Alles, was ein Ingenieur tun muss, ist, auf einen Link zu klicken – und er hat alles, was er braucht, an einem Ort. Dieses Maß an Integration und Einfachheit hilft uns, schneller und effektiver zu reagieren.
Sajeeb Lohani
Globaler Technischer Informationssicherheitsbeauftragter (TISO), Bugcrowd
Fallstudie lesen
Ressourcenzentrum

Verlässlichkeit und zufriedene Kunden mit SLOs

Das 2016 gegründete Unternehmen Laurel mit Sitz in den USA nutzt KI, um Juristen und andere Fachleute von der Last der Zeiterfassung zu befreien, indem es die Abrechnung professioneller Dienstleistungen automatisiert. Das von Venture Capital unterstützte Unternehmen konzentriert sich mit seinen Teams in den USA, Kanada und Großbritannien auf Anwaltskanzleien weltweit.

Branche

Inhaltsverzeichnis

    Wenn Zeit Geld ist: Wie SLOs die Plattformleistung für eine präzise Zeiterfassung optimieren

    Ergebnisse auf einen Blick

    Verbesserter Einblick in die Endbenutzererfahrung
    Reduzierte Fehlalarme und Eskalationen
    Konsolidierte Überwachungstools
    Eine klare Antwort auf die Frage „Sind unsere Kunden zufrieden?“

    Herausforderung

    Bei zu vielen Überwachungsanbietern hatte Laurel zahlreiche blinde Flecken und konnte nicht feststellen, ob sie die Kundenversprechen einhielten.

    Laurel hat es sich zur Aufgabe gemacht, seine Kunden bei der Automatisierung von Zeiterfassungs- und Abrechnungsprozessen zu unterstützen. Da die meisten Anwälte ausschließlich Microsoft-Produkte verwenden, interagieren sie mit dem System von Laurel hauptsächlich über die Windows-Desktop-Anwendung.

    Neun externe Anbieter überwachten die Systeme von Laurel, was die Zuverlässigkeit der Desktop-Anwendung und der kundenspezifischen Infrastrukturarchitektur zu einer Herausforderung machte.

    Trotz dieser Vielzahl an Lösungen gab es viele blinde Flecken bei der Zuverlässigkeit – man wusste nicht, ob man die Erwartungen der Kunden an ein effizientes Zeitmanagement erfüllte. Da es lediglich Alarme für die CPU- und Speicherauslastung ihrer Container gab, wurden viele wenig aussagekräftige Warnmeldungen schlichtweg ignoriert. Zudem war die Rufbereitschaft ungeordnet und umfasste sogar Personen, die gar nicht mehr im Unternehmen waren.

    Die Produkt- und Engineering-Teams von Laurel unterzogen ihre aktuellen Arbeitsabläufe einer kritischen Prüfung – und stellten fest, dass diese unzureichend waren. Sie mussten ihren grundlegenden Ansatz und ihr Verständnis der Infrastrukturüberwachung korrigieren und dabei gleichzeitig das Wohlbefinden ihrer Techniker durch mehr Klarheit und weniger Stress verbessern.

    Laurel führte eine Ausschreibung (RFP) mit neun Anbietern durch, um eine Monitoring-Lösung zu finden, die eine umfassendere Transparenz bietet. Die Produkt- und Engineering-Teams von Laurel entschieden sich zudem für einen SLO-Ansatz (Service Level Objective) in Bezug auf die Zuverlässigkeit und machten sich gezielt auf die Suche nach Lösungen, die darauf ausgerichtet waren.

    „Wir haben Alerts, wir haben Kennzahlen, wir haben Traces, wir haben Logs – aber wir wissen nicht wirklich, ob unsere Kunden mit unserem Produkt zufrieden sind. Das ist frustrierend und nicht gerade das Gespräch, das ich mit unserer Geschäftsführung führen möchte“, sagt Nat Welch, Lead Cloud Platform Engineer bei Laurel.

    Lösung

    Letztlich hatte Laurel zwei Ziele:

    1. sicherstellen, dass die Kunden mit ihrem Angebot zufrieden sind und sich auf ihr Produkt verlassen können.
    2. für die psychische Gesundheit der Mitarbeiter von Laurel sorgen, indem sie ihre Zeit auf hochwertige Aufgaben konzentrieren

    Laurel wählte Sumo Logic als seine Überwachungsplattform. Sumo Logic arbeitete nahtlos mit den anderen Tools zusammen, die in die neuen Arbeitsabläufe integriert wurden, wie z. B. OpsGenie für den Bereitschaftsdienst und OpenTelemetry zur Vereinfachung und Erweiterung der Erfassung.

    headshot laurel nat welch 1

    „Wir möchten unseren Kunden ein gutes Produkt bieten, aber auch die psychische Gesundheit unserer Techniker fördern, während sie unser Produkt entwickeln.“

    – Nat Welch, Lead Cloud Platform Engineer, Laurel

    Ergebnisse

    Sind unsere Kunden zufrieden? Das war die Frage, die Laurels Techniker beantworten und der Geschäftsführung gegenüber souverän kommunizieren mussten.

    Operationalisierung von SRE-Praktiken und App-Zuverlässigkeit durch SLOs

    Das Engineering-Team von Laurel benötigte tiefere Einblicke in die Kundenerfahrung, die über das einfache Monitoring durch Standard-Dashboards hinausgingen. Mithilfe der Reliability-Management-Lösung von Sumo Logic definierte und überwachte das Team daraufhin entsprechende SLOs.

    Zuverlässigkeit, wie sie in SLOs formalisiert ist, hilft den Technikern, sich auf die Überwachung und Fehlerbehebung der Benutzererfahrung zu konzentrieren, indem sie messen, was für die Endbenutzer wichtig ist, und gleichzeitig potenziell bedeutungslose Alarme und falsche Eskalationen reduzieren.

    Das Laurel-Team begann mit zwei SLOs – Anforderungslatenz und API-Erfolg –, um die Haupt-API für ihren Service-Endpunkt zu überwachen und dabei Kundenumgebungen und gemeinsam genutzte Dienste abzudecken.

    dashboard laurel Picture1
    dashboard laurel Picture2

    Mit der automatisierten SLO-Überwachung kann Laurel beim Start neuer Dienste in seiner Anwendung einfach generische SLOs erstellen, um die Benutzererfahrung mit den bereits in Sumo Logic erfassten Daten zu verfolgen. Dasselbe gilt beim Onboarding neuer Kunden.

    dashboard laurel Picture3 2023 04 25 224424 wuks

    Das SLO-Dashboard in der Sumo Logic-Benutzeroberfläche bietet einen aktiven Überblick über den Zustand und den Status der von Laurel überwachten Dienste.

    Das SLO-Dashboard zeigt Folgendes an:

    • Service-Level-Indikatoren (SLIs): Quantitative Messwerte (in der Regel in Prozent) für die System- oder Serviceverfügbarkeit innerhalb des festgelegten Erfüllungszeitraums.
    • Verbleibendes Fehlerbudget: Basierend auf dem SLO ist dies die Restmenge an Fehlern, die auftreten darf, um die Compliance-Vorgaben weiterhin zu erfüllen.
    • Fehlerverlauf: Eine Möglichkeit, Fehler zu verfolgen und zu sehen, wie schnell sie behoben werden, um unnötige Warnungen zu vermeiden.
    headshot laurel nat welch 1

    „Bei unserem vorherigen Alarmsystem hätte wahrscheinlich jeder Fehler einen Alarm ausgelöst und jemanden aufgeweckt oder bei der Arbeit unterbrochen. Und da wir nur 50 Techniker haben, ist das nicht so toll. Davon kommen wir jetzt weg.“

    – Nat Welch, Lead Cloud Platform Engineer, Laurel

    Nahtlose Nutzung und Zugriff auf Daten mit Tool-Konsolidierung

    Da Laurel Sumo Logic als Observability-Lösung nutzt, ist eine Datenmigration in andere Monitoring-Tools nicht erforderlich. Die Daten werden zwischen den verschiedenen Funktionen geteilt und sind überall zugänglich, was zusätzliche Schritte im SLO-Monitoring-Prozess überflüssig macht. Zudem kann Laurel die aus Sumo Logic exportierten Rohdaten in benutzerdefinierten Dashboards verwenden.

    headshot laurel nat welch 1

    „Die SLO-Lösung von Sumo Logic nutzte bereits vorhandene Daten. Einer der Hauptgründe, warum wir keinen neuen Kunden einführen wollten, war, dass wir erst eine Art Pipeline hätten aufbauen müssen, um die Daten dorthin zu übertragen.“

    – Nat Welch, Lead Cloud Platform Engineer, Laurel

    Innovationen für mehr Produktivität

    Das Produktteam von Sumo Logic hat Terraform-Unterstützung hinzugefügt, um die Einrichtung und Überwachung der SLOs bei Laurel zu rationalisieren. Dank dieser Integration musste das Team von Laurel nur 90 Zeilen Code schreiben, um die paar hundert SLOs zu erstellen, die für ihren Kundenstamm benötigt wurden.

    „Einige der Probleme, die wir mit unseren alten Monitoring-Anbietern hatten, resultierten daraus, dass sie ihr Produkt über mehrere Jahre hinweg nicht verändert hatten. Sumo Logic hingegen hat ständig Innovationen vorangetrieben und verfügte zudem über eine faire Preisstruktur, was für uns als Startup besonders wichtig ist“, so Welch.