모든 데이터 포인트를 함께 보지 않고 데이터를 수집하면 큰 그림을 제대로 볼 수 없습니다. 중요한 데이터 포인트가 누락되었을 때의 영향은 말할 것도 없습니다! 안타깝게도 애플리케이션은 매우 복잡한 시스템으로 수많은 데이터 포인트를 생성합니다. 이러한 큰 그림을 볼 수 있는 유일한 방법은 고품질 텔레메트리 를 사용하는 것입니다. 즉, 다양한 유형의 데이터를 수집하고 분석하여 놓치는 것이 없는지 확인하는 것입니다. 하지만 어떤 유형의 데이터를 수집할지 어떻게 알 수 있으며 데이터 수집을 어떻게 관리할 수 있을까요? Sumo Logic은 OpenTelemetry 에 미래를 걸었습니다. 이 가이드를 통해 텔레메트리에 대해 자세히 알아보고 저희가 OpenTelemetry를 선택한 이유를 이해하실 수 있습니다.
텔레메트리 데이터 기초
OpenTelemetry의 놀라운 기능을 살펴보기에 앞서, telemetry의 개념과 그 안에서 다루게 될 데이터 유형을 이해해야 합니다. 먼저 ‘텔레메트리(telemetry)’는 그리스어 어원인 tele(멀리)와 metron(측정하다)에서 유래한 용어입니다. 옵저버빌리티에 적용되는 ‘원격 측정’이라는 개념은 애플리케이션에서 실제로 어떤 일이 일어나고 있는지 이해하는 데 필요합니다. 로그, 메트릭, 트레이스라는 세 가지 주요 유형의 데이터를 수집하고 분석해야 합니다.
- 로그
애플리케이션 내에서 작업이 발생할 때마다 로그 파일이 생성됩니다. 이 데이터는 이벤트를 포착하여 애플리케이션이 제대로 작동하는지 파악할 수 있는 단서를 제공합니다. DevOps 팀은 로그를 사용하여 동시에 발생한 이벤트를 확인하여 오류와 문제를 빠르게 찾아서 수정할 수 있습니다.
- 메트릭
메트릭은 응답 시간이나 메모리 사용량과 같은 핵심 성과 지표(KPI)입니다. 타임스탬프와 관련된 데이터 포인트라고 생각하면 됩니다. 이 데이터는 시스템 상태에 대한 더 큰 맥락을 제공하므로 문제를 신속하게 식별할 수 있습니다.
- 트레이스
로그와 메트릭은 퍼즐을 완성하는 중요한 조각이지만, 본질적으로 특정 시점에 스토리지의 파일 시스템을 포착하는 데 그칩니다. 트레이스는 처음부터 끝까지 이야기의 흐름을 보여주는 단편 영화에 가깝습니다. 트레이스는 전체 애플리케이션 시스템을 통해 요청을 추적하여 그 과정의 모든 상호 작용을 기록하고 예상과 다른 동작을 찾을 수 있도록 합니다.
이러한 모든 유형의 데이터는 서로 다른 작업을 통해 생성되며 애플리케이션 전반의 다양한 위치에서 발생합니다. 이는 마치 ‘바벨탑’과 같은 상황으로, 서로 다른 조각이 다른 ‘언어’를 사용하기 때문에 최종 사용자가 데이터를 활용하기 어렵습니다. 이 문제는 옵저버빌리티 도구의 설계 방식에 내재되어 있습니다! 결국, 각 옵저버빌리티 백엔드는 데이터를 주고받는 고유한 독점 방식을 가지고 있으며, 백엔드 솔루션 간에 표준화된 데이터 형식은 없습니다.
따라서 사용 중인 옵저버빌리티 백엔드를 바꾸려면, 새 도구로 텔레메트리 데이터를 보내기 위해 모든 것을 완전히 재구성해야 합니다. 궁극적으로 이 복잡하게 얽힌 문제는 표준화 없이는 데이터 이동성이 없으며, 비즈니스에 필요한 실행 가능한 인사이트를 얻기 위해 텔레메트리를 유지 관리해야 하는 막대한 부담이 따르는 두 가지 핵심 문제로 요약됩니다.

다행히도 OpenTelemetry로 해결할 수 있습니다.
OpenTelemetry 및 Sumo Logic 사용 사례
- 인프라 모니터링
인프라를 모니터링하면 다음과 같은 문제에 대한 인사이트를 얻을 수 있습니다.- 운영 실패
- 용량 문제
- 보안 침해
- 악의적 공격
OpenTelemetry는 이러한 문제를 포착하는 모든 관련 이벤트 로그와 시스템 메트릭을 수집하여 백엔드로 전송합니다. Sumo Logic과 통합되면 OTel 데이터를 시각화하는 표준 및 사용자 정의 대시보드에 액세스하여 주요 문제를 빠르고 쉽게 식별하고 해결할 수 있습니다.
OpenTelemetry 및 Sumo Logic의 강력한 기능을 사용하여 Kubernetes, MySQL, AWS, GCP 등의 환경을 쉽게 모니터링할 수 있습니다. OTel은 Sumo Logic 인프라 모니터링의 효율성을 크게 향상시키며, 다양한 에이전트를 설치하거나 관리할 필요가 없습니다! 메트릭, 로그, 트레이스를 손쉽게 통합하여 전체 스택에 대한 옵저버빌리티를 확보할 수 있습니다.
- 애플리케이션 옵저버빌리티(APM)
Sumo Logic은 애플리케이션에서 가져온 OpenTelemetry 데이터를 수집, 분석, 상호 연관시킬 수 있는 통합 플랫폼을 제공합니다. 애플리케이션 성능 저하가 발생하는 위치를 신속하게 진단한 다음 문제를 해결하고 근본 원인을 찾을 수 있습니다.
OpenTelemetry 고객 성공 사례: GoSpotCheck
GoSpotCheck는 현장 담당자가 업무 중에 실시간 비즈니스 인텔리전스를 수집할 수 있도록 지원하는 앱입니다. 예를 들어, 다수의 브랜드는 자사 제품이 매장 진열대에 진열되는 방식과 위치에 대해 구체적인 계약을 체결합니다. 이전에는 현장 담당자가 이 과정을 직접 확인하고 종이와 펜으로 기록하여 보고해야 했습니다. GoSpotCheck는 모바일 앱 을(를) 통해 이 문제를 해결했습니다.
GoSpotCheck의 프런트엔드는 직관적인 인터페이스인 반면, 그 스택의 백엔드는 매우 복잡합니다. 이 시스템에는 Kubernetes 인프라, Postgres, Go, Rails가 ML 및 데이터 파이프라인과 결합되어 있습니다. GoSpotCheck는 고객을 위해 지속적으로 서비스를 제공해야 하는 상황에서 풀스택 옵저버빌리티만이 문제를 미리 파악할 수 있는 유일한 방법이라는 것을 알고 있었습니다. 문제는 전체 시스템에 대한 옵저버빌리티를 제공할 수 있는 솔루션을 찾는 것이었습니다. 그때 등장한 것이 바로 Sumo Logic과 OpenTelemetry였습니다. 이러한 도구와 표준 세트를 사용하여 GoSpotCheck는 모든 이벤트, 메트릭, 로그, 트레이스, 뷰, 사용자를 한곳에서 관리할 수 있었습니다.
GoSpotCheck와 OpenTelemetry에 대해 자세히 알아보세요.
OpenTelemetry는 안전한가요?
네, OpenTelemetry는 기본적으로 뛰어난 보안 기능을 제공합니다. 사용자 정의 코드가 있는 솔루션은 심각한 보안 문제를 야기하지만, OTel은 이를 염두에 두고 구축되었습니다. OpenTelemetry는 다음을 지원합니다.
- 엔드투엔드 암호화 및 프로토콜 (HTTPS, gRPC-TLS 등) 을 통해 전송 중 데이터 액세스를 방지합니다.
- 상호 TLS(mTLS)는 상호 인증을 통해 네트워크 연결의 각 종단이 올바른 개인 키로 검증되도록 보장합니다.
역할 기반 액세스 제어(RBAC), 즉 역할 기반 보안은 승인된 특정 사용자별로 권한을 설정하여 시스템 액세스를 제한할 수 있습니다.
OpenTelemetry 대 Prometheus
OpenTelemetry와 Prometheus는 모두 CNCF(Cloud Native Computing Foundation)라는 같은 뿌리에서 나온 오픈 소스 옵저버빌리티 프로젝트입니다. OpenTelemetry가 텔레메트리 데이터의 계측 및 수집을 위한 도구와 표준을 대표하는 반면, Prometheus는 데이터를 사람이 읽을 수 있는 대시보드로 변환하는 옵저버빌리티 백엔드입니다. OpenTelemetry는 분산 시스템 모니터링의 최적 표준으로 자리 잡았으며, 현재 CNCF에서 Kubernetes에 이어 두 번째로 인기 있는 오픈 소스 프로젝트입니다.
반면 Prometheus는 OpenTelemetry 수집 에이전트를 활용하는 메트릭 모니터링 도구입니다. Prometheus의 메트릭은 로그의 타임키퍼 역할을 하며, 수학 라이브러리와 고유 쿼리 언어(PromQL)를 사용하여 기본적인 데이터 시각화를 가능하게 합니다. 이 프로젝트들의 전반적인 목적, 비전 및 확장성은 크게 다릅니다. Prometheus는 메트릭 수집에만 집중하는 반면, OpenTelemetry는 Prometheus가 데이터를 수집할 수 있는 표준 세트로 작동합니다. Prometheus의 난해한 특성을 고려할 때, 사용자는 Sumo Logic과 같이 모든 데이터 유형을 다루는 엔터프라이즈 데이터 시각화 도구 사용을 고려할 수 있습니다.
Sumo Logic은 OpenTelemetry를 어떻게 지원하나요?
Sumo Logic은 OpenTelemetry를 지원할 뿐 아니라 이 중요한 도구를 더욱 개선하는 데 기여하고 있습니다. 예를 들어, OpenTelemetry를 기반으로 Sumo OTel Collector를 만들어 옵저버빌리티를 위한 로그, 메트릭, 트레이스, 메타데이터를 Sumo Logic으로 보내는 단일 통합 에이전트를 제공합니다. 컬렉터는 복잡한 분산 시스템을 위한 간소화되고 효율적인 성능 및 행동 모니터링을 제공합니다. 이를 통해 문제를 손쉽게 파악할 수 있고, 결과적으로 시스템 전반의 신뢰성과 효율성이 높아집니다.
옵저버빌리티의 미래는 무엇인가요?
데이터 복잡성이 증가함에 따라 명확한 옵저버빌리티의 필요성이 더욱 중요해지고 있습니다. 옵저버빌리티의 미래를 결정짓는 두 가지 핵심 요소는 ‘개방형 표준에 대한 헌신’과 ‘고급 분석의 힘’입니다. Sumo Logic은 이러한 진화에 적극적으로 시간과 노력을 들이고 있으며, 특히 OpenTelemetry 지원을 통해 그 변화를 이끌어 나갑니다. 단순히 변화를 관찰하는 것에 그치지 않고, 그 변화를 직접 주도하고 있습니다. 이것이 무엇을 의미하는지 살펴보겠습니다.
개방형 표준에 대한 헌신: 옵저버빌리티를 총체적이고 효율적으로 구현하려면 미래의 플랫폼은 개방형 표준에 깊이 뿌리를 두어야 합니다. 데이터 수집을 위한 OpenTelemetry 표준이 옵저버빌리티 환경을 지배할 것으로 예상됩니다. 이러한 개방형 표준은 상호 운용성을 촉진하고 로그, 메트릭, 트레이스 등 모든 데이터의 바이트 하나하나가가 출처와 관계없이 가치를 제공하도록 보장합니다.
다양한 환경에서의 고급 분석 마스터: 오늘날의 멀티 클라우드 및 하이브리드 환경에서 생성되는 엄청난 양의 데이터는 고급 분석 기능을 필요로 합니다. 단순히 데이터를 수집하는 것이 아니라 데이터를 실행 가능한 인사이트로 변환하는 것이 중요합니다. 미래의 옵저버빌리티 도구는 방대한 데이터 스트림을 식별 가능한 패턴으로 변환하고 이상 징후를 식별하며 원시 데이터 표현에서는 잘 드러나지 않던 상관관계를 밝혀낼 수 있도록 조직을 지원할 것입니다. 이는 다양한 온프레미스, 퍼블릭 클라우드, 프라이빗 클라우드 소스에서 데이터를 가져오는 복잡한 멀티 클라우드 및 하이브리드 생태계를 탐색하는 팀에게 특히 유용할 것입니다. 이러한 환경 전반에 걸친 통합된 관점
엔터프라이즈급 공급업체로서 Sumo Logic은 개방형 표준과 통합 수집의 강점을 전적으로 수용했습니다. 우리는 커뮤니티가 협력할수록 더 강력해진다는 사실을 직접 확인했으며, 옵저버빌리티의 미래는 OpenTelemetry 표준화에 있다고 확신합니다.
OpenTelemetry를 어떻게 시작하나요?
시스템이 복잡한 경우 OTel을 시작하는 것이 특히 부담스럽게 느껴질 수 있습니다. 걱정하지 마세요! OpenTelemetry를 시작하는 데 도움이 되는 다양한 튜토리얼을 온라인에서 이용할 수 있습니다. Sumo Logic에서 일반적인 OpenTelemetry 데모 애플리케이션을 Sumo Logic과 함께 사용하는 방법에 관한 가이드를 준비했습니다.
여전히 부담스러우신가요? 저희가 도와드리겠습니다. 좋은 파트너로서, 여러분이 OpenTelemetry를 쉽고 효율적으로 활용할 수 있도록 지원해 드립니다.