Preise Anmelden Kostenlos testen Support
Alles, was ein Ingenieur tun muss, ist, auf einen Link zu klicken – und er hat alles, was er braucht, an einem Ort. Dieses Maß an Integration und Einfachheit hilft uns, schneller und effektiver zu reagieren.
Sajeeb Lohani
Globaler Technischer Informationssicherheitsbeauftragter (TISO), Bugcrowd
Fallstudie lesen
Ressourcenzentrum

Verlässlichkeit und zufriedene Kunden mit SLOs

Das 2016 gegründete Unternehmen Laurel mit Sitz in den USA nutzt KI, um Juristen und andere Fachleute von der Last der Zeiterfassung zu befreien, indem es die Abrechnung professioneller Dienstleistungen automatisiert. Das von Venture Capital unterstützte Unternehmen konzentriert sich mit seinen Teams in den USA, Kanada und dem Vereinigten Königreich auf Anwaltskanzleien weltweit.

Branche

Inhaltsverzeichnis

    Wenn Zeit Geld ist: Wie SLOs die Plattformleistung für eine genaue Zeiterfassung optimieren

    Ergebnisse auf einen Blick

    Verbesserter Einblick in die Endbenutzererfahrung
    Reduzierte Fehlalarme und Eskalationen
    Konsolidierte Überwachungstools
    Eine klare Antwort auf die Frage „Sind unsere Kunden zufrieden?“

    Herausforderung

    Bei zu vielen Überwachungsanbietern hatte Laurel zahlreiche blinde Flecken und konnte nicht feststellen, ob sie die Kundenversprechen einhielten.

    Laurel hat es sich zur Aufgabe gemacht, seine Kunden bei der Automatisierung von Zeiterfassungs- und Abrechnungsprozessen zu unterstützen. Die meisten Anwälte verwenden ausschließlich Microsoft-Produkte und interagieren daher hauptsächlich über die Windows-Desktop-Anwendung mit dem System von Laurel.

    Neun externe Anbieter überwachten die Systeme von Laurel, was die Zuverlässigkeit der Desktop-Anwendung und der Infrastrukturarchitektur pro Kunde zu einer Herausforderung machte.

    Selbst mit dieser Reihe von Lösungen gab es viele Schwachstellen in Bezug auf die Zuverlässigkeit – man wusste nicht, ob man die Erwartungen der Kunden hinsichtlich eines effizienten Zeitmanagements erfüllte. Da die Container nur Alarme für CPU und Speicher enthielten, wurden viele schlecht angereicherte Alarme ignoriert. Ihr Bereitschaftsdienst war unorganisiert und bestand aus Leuten, die nicht mehr im Unternehmen waren.

    Die Produkt- und Entwicklungsteams von Laurel haben ihre aktuellen Arbeitsabläufe unter die Lupe genommen – und festgestellt, dass sie unzureichend sind. Sie mussten ihre allgemeine Herangehensweise und ihr Verständnis von Infrastrukturüberwachung korrigieren und dabei das Wohlbefinden ihrer Ingenieure durch mehr Klarheit und weniger Stress verbessern.

    Laurel führte eine Ausschreibung (RFP) mit neun Anbietern durch und suchte nach einer Überwachungslösung, die einen breiteren Überblick bietet. Die Produkt- und Technikteams von Laurel entschieden sich außerdem für einen SLO-Ansatz (Service Level Objective) in Bezug auf die Zuverlässigkeit und machten sich auf die Suche nach Lösungen, die diesem Ansatz entsprachen.

    „Wir haben Warnmeldungen, wir haben Messdaten, wir haben Traces, wir haben Protokolle, aber wir wissen nicht wirklich, ob unsere Kunden mit unserem Produkt zufrieden sind. Das ist frustrierend und nicht wirklich das Gespräch, das ich mit unserer Führungsebene führen möchte“, sagte Nat Welch, Lead Cloud Platform Engineer bei Laurel.

    Lösung

    Letztlich hatte Laurel zwei Ziele:

    1. Sicherzustellen, dass die Kunden mit ihrem Angebot zufrieden sind und sich auf ihr Produkt verlassen können.
    2. Für die psychische Gesundheit der Mitarbeiter von Laurel zu sorgen, indem sie ihre Zeit auf hochwertige Aufgaben konzentrieren

    Laurel hat sich für Sumo Logic als Überwachungsplattform entschieden. Sumo Logic arbeitete nahtlos mit den anderen Tools zusammen, die sie in ihre neuen Arbeitsabläufe integriert haben, wie OpsGenie für ihre Bereitschaftsrotation und OpenTelemetry zur Vereinfachung und Erweiterung der Erfassung.

    headshot laurel nat welch 1

    „Wir möchten unseren Kunden ein gutes Produkt bieten, aber auch die psychische Gesundheit unserer Ingenieure verbessern, während sie unser Produkt bauen.“

    – Nat Welch, Lead Cloud Platform Engineer, Laurel

    Ergebnisse

    Sind unsere Kunden zufrieden? Das ist die Frage, die Laurels Ingenieure beantworten und der Geschäftsleitung selbstbewusst mitteilen können müssen.

    Operationalisierung von SRE-Praktiken und App-Zuverlässigkeit durch SLOs

    Das technische Team von Laurel benötigte einen tieferen Einblick in das Kundenerlebnis, der über die Basisüberwachung durch die Standard-Dashboards hinausging. Das Team definierte und verfolgte SLOs mit der Reliability Management-Lösung von Sumo Logic.

    Zuverlässigkeit, wie sie in SLOs formalisiert ist, hilft den Technikern, sich auf die Überwachung und Fehlerbehebung der Benutzererfahrung zu konzentrieren, indem sie messen, was für die Endbenutzer wichtig ist, und gleichzeitig potenziell bedeutungslose Alarme und falsche Eskalationen reduzieren.

    Das Laurel-Team begann mit zwei SLOs – Anforderungslatenz und API-Erfolg –, um die Haupt-API für ihren Service-Endpunkt zu überwachen und dabei Kundenumgebungen und gemeinsam genutzte Dienste abzudecken.

    dashboard laurel Picture1
    dashboard laurel Picture2

    Mit der automatisierten SLO-Überwachung kann Laurel beim Start neuer Dienste in seiner Anwendung ganz einfach generische SLOs erstellen, um die Benutzererfahrung anhand der bereits in Sumo Logic erfassten Daten zu verfolgen. Das Gleiche gilt, wenn sie neue Kunden an Bord nehmen.

    dashboard laurel Picture3 2023 04 25 224424 wuks

    Das SLO-Dashboard in der Sumo Logic-Benutzeroberfläche bietet eine aktive Ansicht des Zustands und des Status der Dienste, die Laurel überwacht.

    Das SLO-Dashboard zeigt Folgendes an:

    • Service-Level-Indikatoren (SLIs): Quantitative Angaben (in der Regel in Prozent) zur System- oder Serviceverfügbarkeit innerhalb des festgelegten Erfüllungszeitraums.
    • Verbleibendes Fehlerbudget: Basierend auf dem SLO ist dies die verbleibende Anzahl von Fehlern, die auftreten können, ohne dass die Vorschriften verletzt werden.
    • Fehlerverlauf: Eine Möglichkeit, Fehler zu verfolgen und zu sehen, wie schnell sie behoben werden, um unnötige Warnungen zu vermeiden.
    headshot laurel nat welch 1

    „Bei unserer vorherigen Alarmierung hätte wahrscheinlich jeder Fehler einen Alarm ausgelöst und jemanden aufgeweckt oder bei der Arbeit unterbrochen. Und da wir nur 50 Ingenieure haben, ist das nicht so toll. Davon entfernen wir uns.“

    – Nat Welch, Lead Cloud Platform Engineer, Laurel

    Nahtlose Nutzung und Zugriff auf Daten mit Toolkonsolidierung

    Da Laurel Sumo Logic als Überwachungslösung einsetzt, müssen die Daten nicht zu anderen Überwachungs-Tools migriert werden. Die Daten werden gemeinsam genutzt und sind für alle Funktionen zugänglich, wodurch Schritte im SLO-Überwachungsprozess entfallen. Laurel kann die von Sumo Logic exportierten Rohdaten auch in benutzerdefinierten Dashboards verwenden.

    headshot laurel nat welch 1

    „Die SLO-Lösung von Sumo Logic nutzte vorhandene Daten. Einer der Hauptgründe, warum wir keinen neuen Kunden anlegen wollten, war, dass wir eine Art Leitung hätten einrichten müssen, um die Daten zu übertragen.“

    – Nat Welch, Lead Cloud Platform Engineer, Laurel

    Innovationen für mehr Produktivität

    Das Produktteam von Sumo Logic hat Terraform-Unterstützung hinzugefügt, um die SLO-Einrichtung und -Überwachung von Laurel zu optimieren. Dank dieser Integration brauchte das Laurel-Team nur 90 Zeilen Code zu schreiben, um die wenigen hundert SLOs zu erstellen, die es für seine Kunden benötigte.

    „Einige der Probleme, die wir mit einigen unserer früheren Überwachungsunternehmen hatten, bestanden darin, dass sie ihre Produkte über mehrere Jahre hinweg nicht verändert hatten. Sumo Logic war ständig innovativ und hatte außerdem eine vernünftige Preisstruktur, was für uns als Start-up wichtig ist“, sagte Welch.