문제점
LendingTree는 중단, 장애, 기타 예기치 않은 이벤트를 최소화하여 오랜 가동 시간을 유지하는 데 집중하고 있습니다. 이로써 800만 명이 넘는 고객에게 더 나은 서비스를 제공하는 동시에 매출 손실을 초래하는 중단을 줄이고 있습니다. 또한 혁신과 비용 절감을 위한 새로운 방안을 지속적으로 모색하고 있으며, Kubernetes 프로젝트는 그 대표적인 사례 중 하나입니다. Kubernetes는 클라우드 컴퓨팅 워크로드를 여러 벤더의 플랫폼에 분산함으로써 안전성을 상당히 향상시킬 수 있는 잠재력을 지녔습니다. 그러나 LendingTree는 분산된 환경의 상태를 일관되게 파악하고, 원인에 상관없이 즉시 문제를 인지하며, 그러한 문제를 빠르게 해결하는 통합적 접근 방식을 찾아야 했습니다.
솔루션
Lendingtree는 이전에 진행한 머신 데이터 집계 이니셔티브의 일환으로 이미 Sumo Logic의 클라우드 기반 솔루션을 도입한 상태였습니다. 이번 프로젝트의 다음 단계에서는 새로 구축된 Kubernetes 환경에서 생성되는 로그, 메트릭, 이벤트를 인제스트하고 이를 Sumo Logic 내에서 시각화하는 작업이 포함되었습니다.
“저희의 요구에 정확하게 부합하는 여러 클라우드 벤더를 최적으로 조합하여 선택할 수 있도록 Kubernetes를 도입하고 있습니다. 이는 Sumo Logic의 클라우드 중립성 덕분에 가능한 일입니다.”
—제러미 프로핏(Jeremy Proffitt), 수석 사이트 신뢰성 엔지니어
결과
LendingTree 환경 전반에서 머신 데이터를 수집, 관리, 분석하는 초기 Sumo Logic 도입 결과 이미 상당한 재정적 이익을 얻었습니다. 서비스 중단의 횟수와 심각도를 줄이는 것만으로도 매년 수백만 달러의 비용을 절감할 수 있었습니다.