결과 요약
문제점
Ulta Beauty의 전자 상거래 채널은 2억 달러에서 20억 달러 이상으로 성장했습니다. 그리고 이 업체의 디지털 채널이 기하급수적으로 성장함에 따라 디지털 과제 또한 증가했습니다.
Ulta Beauty의 전자 상거래 및 디지털 시스템 IT 디렉터인 Omar Koncobo는 10년 전에 이 리테일 업체에 입사한 후로 자사의 전자 상거래 채널이 현재 20억 달러 이상의 규모로 성장하는 것을 지켜보았습니다.
휴가 시즌에는 트래픽이 기하급수적으로 급증했고, 그 때문에 사내 온프레미스 환경의 커버리지를 위해 추가 인프라를 구축하고 연중 나머지 기간에는 정상적인 트래픽을 위해 오버프로비저닝을 해야 했습니다. 이러한 설정에서는 변경의 어려움으로 인해 고객 경험이 저하되었는데, 고객 경험(CX) 개선을 위해 신속한 사용자 지정이 필요한 상황에 비해 출시 시간이 너무도 느렸습니다. 코드 한 줄을 변경하기 위해선 전체 스택을 배포해야 했지요.
이러한 문제를 해결하기 위해 Ulta Beauty는 클라우드로 마이그레이션하고 마이크로서비스와 API를 우선하는 접근 방식을 채택하기로 했습니다. 클라우드 제공업체로는 Google Cloud Platform(GCP)을 선정했습니다. Ulta Beauty는 애플리케이션 마이그레이션에 ‘스트랭글러 패턴'(strangler pattern) 접근 방식을 채택하여 모놀리스의 일부를 한 번에 하나의 마이크로서비스씩 클라우드로 이동하고, 온프레미스 시스템과 새로운 GCP 스택 간에 트래픽과 요청이 올바르게 흐르도록 로드 밸런싱을 수행했습니다.
마이그레이션 과정에서 두 개의 시스템을 운영하던 Ulta Beauty에게는 새로운 스택의 안정성과 보안성을 모니터링하는 동시에 비즈니스 성과와 애플리케이션 성능을 보장하여 매출 감소를 방지할 수 있는 옵저버빌리티 솔루션이 필요했습니다. Ulta Beauty의 엔지니어들은 대규모 전환을 도울 수 있을 만한 벤더가 필요하다는 사실을 알고 있었습니다. 이들이 이상적으로 원하는 전략적 파트너는 Ulta Beauty가 매출 목표를 계속 달성하는 가운데 모범 사례를 채택하고 올바른 패턴을 확립하면서 워크플로를 현대화할 수 있도록 지원하는 업체였습니다.
솔루션
Ulta Beauty의 엔지니어들은 풀스택 옵저버빌리티를 위한 전략적 파트너로 Sumo Logic을 선택했습니다. Sumo Logic의 클라우드 네이티브 SaaS 분석 플랫폼은 시스템에 대한 포괄적 가시성과 비즈니스 목표에 맞는 실행 가능한 실시간 인사이트를 제공합니다.
서버를 GCP로 마이그레이션할 때 그에 맞게 확장할 역량을 갖춘 Sumo Logic의 모니터링 기능에 힘입어, Ulta Beauty는 스택의 안정성과 보안성을 보장하고 비즈니스 성과와 애플리케이션 성능을 모니터링하는 강력한 대시보드도 확보할 수 있었습니다.
이제 Ulta Beauty는 인프라 유지 관리에서 벗어나 애플리케이션 배포에 집중할 수 있습니다.

“레거시 시스템을 이 새로운 플랫폼으로 마이그레이션할 때는 반드시 지켜야 할 매출을 유념하고 있어야 합니다. 옛 시스템에서 새 시스템으로 옮기는 과정에서 매출이 감소해서는 안 되죠. 시스템 개선과 함께 매출도 늘어야 합니다.”
—Omar Koncobo, 전자 상거래 및 디지털 시스템 IT 디렉터
결과
Ulta Beauty의 최우선 과제는 클라우드로 마이그레이션하는 동안 매출을 보호하는 일이며, 따라서 문제를 신속히 파악하고 해결해야 합니다. Sumo Logic의 강력한 데이터 시각화 기능을 통해 Ulta Beauty는 비즈니스의 다양한 측면을 종합적으로 파악하도록 돕는 대시보드를 만들 수 있습니다. Sumo Logic의 기본 제공 대시보드 기능을 통해 Ulta Beauty의 전자 상거래 및 디지털 시스템 팀과 회사의 다른 이해관계자들은 데이터 시각화를 개선하고 운영, 안정성 및 보안 문제를 신속히 식별할 수 있게 되었습니다.
신속한 운영, 안정성 및 보안 문제 식별
Ulta Beauty는 최상위의 뷰티 리테일 업체로서 수년간 축적된 데이터를 토대로 비즈니스 지표에 대해 확실한 벤치마킹을 설정해 두었습니다. Google Kubernetes Engine(GKE) 스택, 네트워크 구성 요소 및 기타 내부 시스템 메트릭의 모니터링을 전담하는 대시보드가 있긴 하지만, 비즈니스 수치를 관찰하면 자사 운영의 다양한 측면을, 실질적으로는 엔드투엔드 사용자 경험을 모니터링할 수 있습니다. 또한 이러한 수치는 과거 성과에 기반한 메트릭의 예측 가능성 덕분에 IT 팀에 잠재적 인프라 문제를 알려줍니다.
GKE 안정성 및 운영 문제 모니터링
주문 흐름 및 거래량 분석을 추적하는 여러 대시보드 중 하나인 주문 인사이트 I(Order Insight I) 대시보드는 시스템 안정성과 엔드투엔드 운영 문제를 모니터링하는 데 있어서 중요한 역할을 합니다. 주문 취소 건수가 증가하면 디지털 채널의 프런트엔드 문제나 창고 측의 재고 문제가 발생했다는 의미일 수 있습니다. 또한 채널별 및 기간별 주문 수를 모니터링하면 스택의 신뢰성과 안정성은 물론이고 벤치마크 수치와의 편차가 눈에 띌 때 발생할 만한 잠재적 문제도 파악할 수 있습니다.

보안 모니터링
Ulta Beauty의 페이지는 엄청난 양의 트래픽과 데이터를 생성하므로 여러 악성 행위자의 표적이 되고 있습니다. 보안은 IT 팀이 고객과 수익원을 보호하기 위해 가장 중요하게 여기는 부분입니다. 자사 사이트에서 호스팅되는 데이터와 상호 작용의 양만 하더라도 매우 방대하며, 따라서 악성 행위자 식별은 공격과 사기 행위의 조짐이 보이는 웹사이트 활동을 추적하는 방식으로 수행합니다.

예를 들어, Ulta Beauty의 무차별 대입 공격(Brute Force Attack) 대시보드는 IP 주소 및 국가별로 잘못된 비밀번호 시도와 로그인 시도 같은 지표를 추적합니다.
비즈니스 성과 및 애플리케이션 성능 모니터링
Ulta Beauty의 경영진은 캠페인 성과를 모니터링하기 위해 이 주문 인사이트(Order Insight) 대시보드에 특별한 주의를 기울입니다. 분당 주문은 앱, 웹사이트, 기타 채널 등에서 주문이 발생한 기간과 채널 소스를 기준으로 추적됩니다. 주문이 몰리는 휴가 시즌에는 세일 가격과 기타 캠페인이 공개되기 전에 장바구니 추가(Add to Bag) 그래프를 확인해서 프로모션 성과에 대한 인사이트를 확보할 수 있습니다. 더 중요한 사실은 이 대시보드에서 얻은 실행 가능한 인사이트를 통해 IT 팀이 유입 트래픽과 사용자 활동에 대비하여 시스템을 가장 잘 준비시켜 둘 수 있다는 점이며, 이러한 장점은 공휴일과 같은 날에 특히 빛을 발합니다.

경고 알림 및 자동화된 인시던트 대응
Ulta Beauty의 대시보드는 전사적인 모니터링 및 문제 식별을 위한 신호등 역할을 하며, 여기에 세밀히 조정된 경고 알림과 부서 간의 개방적 커뮤니케이션을 함께 활용할 수 있습니다. Ulta Beauty는 벤치마크 정보에 기반한 임곗값을 정하여 비즈니스에 중요한 경고 알림을 설정했으며, 이는 Sumo Logic 내에서 프로그래밍된 자동 인시던트 대응과 함께 작동합니다. 이를 통해 Ulta Beauty는 대응 시간을 단축하고 엔지니어링 시간 사용을 최적화하며 매출 손실을 방지할 수 있습니다.
한 가지 사례를 들자면 웹사이트 문제로 인해 모든 제품이 무료로 표시되는 사태가 발생한 적이 있었습니다. 이로 인해 대시보드에 평균 주문 금액이 평소의 60달러가 아닌 5달러 정도로 등록된 것에서 알 수 있듯이 배송 전용(shipping-only) 주문 수가 급증했습니다. 그에 따라 자동 대응이 트리거되어 디지털 채널에서 물류창고로의 주문 흐름을 중단했는데, 이처럼 잘못된 주문이 그대로 처리되어 배송이 진행되었다면 상당한 손실이 발생할 수도 있었습니다.
앞으로의 전망
Ulta Beauty는 레거시 스택에서 GCP로 계속 전환함에 따라 한 걸음 더 나아간 프로세스 최적화, 전략적 벤더 파트너십 구축, Ulta Beauty의 매출 목표에 긍정적으로 기여한다는 중요 목표와 발맞춘 의사 결정에 집중하고 있습니다. 그중 한 가지 사례로는 데이터 이그레스 비용을 절감하고자 Akamai와 맺은 파트너십을 들 수 있는데, 특히 자사의 온프레미스 환경과 클라우드 환경 모두에서 트래픽을 라우팅하는 동안에 효과를 볼 수 있기를 기대하고 있습니다.