가격 로그인 Free trial 무료 체험
특히 Sumo Logic의 강력한 쿼리 기능은 경쟁 우위를 제공하여, 문제가 자주 발생하는 소프트웨어 버전이나 유사한 오류를 식별하는 것처럼 인사이트 있는 결과를 도출해 줍니다.
김영집
EVP, AI 팀장, Samsung
사례 연구 읽기
리소스 센터

글로벌 투자 회사

목차

    점점 더 많은 기업이 최신 애플리케이션을 위해 하이퍼스케일 클라우드 제공업체와 마이크로서비스를 도입하면서, 머신 데이터는 더 빠른 속도로 생성되고 있으며 방대한 데이터 홍수를 가중시키고 있습니다. 그러나 빅데이터가 제공하는 뚜렷한 이점과 함께, 해결해야 할 수많은 과제 역시 존재합니다.

    이를 설명하기 위해 로그 데이터를 살펴보겠습니다. 로그 데이터는 모니터링, 계획 수립, 보안, 최적화를 위한 가장 방대한 단일 데이터 세트입니다. 과거에는 많은 조직이 로그 데이터를 하나의 자원으로서 지닌 잠재력을 간과했지만, 현재는 모니터링 데이터 속에 숨겨진 미개척 자산으로 널리 인식되고 있습니다.

    Screenshot 2023 03 02 at 2.34.11 PM 1


    하지만 방대한 규모와 복잡성으로 인해, 구조화되지 않은 머신 생성 로그 데이터를 대량으로 분류하고 분석하는 작업은 매우 큰 도전 과제입니다. 강력한 로그 관리 프로세스를 활용하면 이러한 대용량·고속 데이터 세트를 보다 수월하게 정리하고 분석할 수 있습니다.

    로그 관리 프로세스란 무엇인가?

    개괄적인 수준에서 보면 로그 관리는 로그와 관련된 모든 측면을 다루며 다음 두 가지 목표를 달성하기 위해 수행됩니다:

    1. 디지털 성능 및 신뢰성 문제 해결, 문제 해결, 포렌식 조사, 비즈니스 인사이트 확보를 위해 데이터를 수집, 저장, 처리, 종합 및 분석합니다.
    2. 기업의 전체 소프트웨어 스택 전반에서 애플리케이션과 인프라의 신뢰성, 규정 준수, 보안을 보장합니다.

    종합적인 로그 관리 프로세스는 절차, 정책, 도구라는 세 가지 핵심 구성 요소로 이루어져 있습니다. Sumo Logic의 가이드는 이러한 개념을 보다 깊이 있게 살펴보기 위해 작성되었습니다.

    로그 관리가 중요한 이유는 무엇인가?

    로그 관리의 핵심은 방대한 양의 로그 이벤트를 수집하고, 구성하며, 상관 분석하여 실시간 분석과 인사이트를 도출하는 것입니다. 이 과정이 중요한 이유는 다음과 같습니다.

    • 보안 강화: 로그 관리를 통해 모든 사용자 활동을 추적할 수 있어 데이터 유출이나 보안 침해, 기타 위험 요소를 예방하고 원인을 파악하며 영향을 최소화하는 데 도움이 됩니다.
    • 시스템 신뢰성 향상: 로그 파일을 모니터링하면 DevOps 담당자가 시스템의 동작 상태를 손쉽게 파악할 수 있습니다. 또한 로그를 관리할 경우 성능 문제가 발생할 때 근본 원인을 신속하게 파악하는 데 도움이 됩니다.
    • 고객 인사이트 향상: 로그 및 로그 분석을 통해 얻은 데이터 인사이트는 보안 및 시스템 성능 개선 이상의 가치가 있습니다. 이 데이터는 고객이 어떤 브라우저를 사용하는지 파악하는 것은 물론 기타 고객 행동과 관련된 인사이트 등 고객이 애플리케이션과 상호작용하는 방식을 이해하는 데도 도움이 됩니다.
    • 데이터 옵저버빌리티 간소화: 로그 관리를 통해 서로 다른 애플리케이션에서 데이터를 수집해 한곳에 저장할 수 있습니다. 이를 통해 애플리케이션 성능, 비즈니스 분석, 문제 해결을 위한 인사이트를 보다 쉽게 확보할 수 있습니다.
    lm Simplified data observability

    2023년 2월 Sumo Logic 고객을 대상으로 실시한 문제 해결 시 가장 유용한 데이터 유형에 대한 설문조사.

    로그 관리 프로세스의 단계는 무엇인가?

    조직마다 세부 내용은 다르지만, 모든 로그 관리 프로세스에는 기본적으로 다섯 가지 단계가 있습니다.

    1. 계측 및 수집

    로그 관리 프로세스의 첫 번째 단계에서는 두 번째 단계인 로그 집계를 지원하기 위해 기술 스택 전반의 여러 위치에서 로그를 수집해야 합니다. 이 절차에서 로그 컬렉터 도구가 사용됩니다. 많은 조직이 rsync나 cron과 같은 기존 도구를 사용해 로그 데이터를 수집하지만, 이러한 도구는 실시간 모니터링을 지원하지 않습니다. 지속적인 모니터링과 검토 프로세스를 유지하려면 모든 로그를 수집하는 것이 매우 중요합니다. 덧붙여 언급할 만한 점은, 오픈 소스 수집을 위한 오픈 텔레메트리 도구를 활용하면 모든 머신 데이터를 생성하고 수집하며 내보낼 수 있다는 것입니다. 이를 통해 기술 스택의 모든 계층에 대한 가시성이 향상되며, 옵저버빌리티가 강화됩니다.

    lm Instrument and collect

    OpenTelemetry는 머신 데이터를 계측하고, 생성하며, 수집하고, 내보내는 데 사용할 수 있는 도구, API, SDK의 집합입니다.
    이는 이제 머신 데이터를 수집하기 위한 사실상의 표준으로 자리 잡아가고 있습니다.

    로그 수집 외에도 파싱(parsing) 은 이 초기 절차의 또 다른 중요한 구성 요소입니다. 로그 파싱은 로그 파일을 해석하기 위해 로그 템플릿과 매개변수를 추출하는 과정입니다. 이를 통해 로그 관리 시스템은 각 파일에 포함된 데이터를 읽고, 분류하며, 저장할 수 있습니다. 로그 파싱은 반정형 및 비정형 데이터 모두에 적용되지만, 비정형 데이터의 경우 추가적인 작업이 필요합니다. 요약하면, 파싱 프로세스는 이해하기 어려운 데이터를 보다 읽기 쉬운 형식으로 변환하는 역할을 합니다.

    기존 도구를 사용할 경우 파싱이 까다로워질 수 있습니다. 로그 데이터는 다양한 형식으로 존재하기 때문에, 기존 도구의 파싱 기능은 모든 로그 파일 형식을 포괄하지 못합니다. 이로 인해 사용자가 직접 커스텀 파싱 도구를 만들어야 하는 경우가 많아 상당한 시간이 소모될 수 있습니다. Sumo Logic과 같은 도구를 사용하면 로그 형식과 관계없이 로그 메시지에서 필드를 추출하여 기존 파싱 방식의 한계를 해결할 수 있습니다. 더 자세한 내용은 파싱 오퍼레이터(parse operators) 자료를 참고하시기 바랍니다.

    2. 중앙 집중화 및 인덱싱

    모든 로그 파일과 데이터가 수집되고 파싱되면, 다음 단계는 집계(aggregation)를 완료하는 것입니다. 로그 집계란 모든 로그를 하나의 플랫폼, 하나의 중앙 위치에 통합하여 단일 진실 공급원(Single Source of Truth)을 만드는 과정을 의미합니다. 집계를 통해 한 곳에 모인 데이터를 인덱싱하면, IT와 보안 팀이 필요한 정보를 보다 효율적으로 검색하고 활용할 수 있습니다.

    중요한 데이터가 IT 인프라 전반에 흩어져 있으면 심각한 비효율이 발생하고 보안 침해 위험도 커집니다. 또한 서로 다른 사용 사례를 위해 동일한 로그 데이터를 여러 번 수집하면 데이터 확보 비용 역시 증가합니다.

    집계의 중요성을 보다 잘 이해하기 위해 사이버 보안에서의 로그 관리를 살펴보겠습니다. 보안 분석가는 침해 사고의 근본 원인과 심각도를 판단하기 위해 로그 이벤트 데이터에 크게 의존합니다. 로그 데이터가 여러 위치에 분산되어 있으면, 사이버 위협을 제거하는 데 필요한 정보를 찾기가 훨씬 어려워집니다. 로그 데이터를 중앙화하고 인덱싱하면 네트워크 전반의 모든 활동을 한눈에 볼 수 있는 통합된 뷰를 제공하여, 위협을 보다 쉽게 식별하고 다른 문제도 신속하게 해결할 수 있습니다. 원격 근무의 급격한 확산으로 사이버 및 데이터 보안과 관련된 새로운 과제가 대두된 만큼, 로그 데이터에 대한 통합된 관점은 대부분의 조직에서 최우선적으로 고려해야 할 요소입니다.

    lm Centralize and index 1

    최대의 효율성을 위해 모든 정형 및 비정형 로그와 보안 이벤트를 단일 보안 데이터 레이크에 저장하세요.

    과거에는 많은 조직이 Syslog 전송 도구만을 사용해 로그 데이터를 중앙 위치로 전송해 왔습니다. Syslog는 방식이 단순해 잘 작동하지만, 확장성이 떨어지는 경우가 많습니다. Sumo Logic의 클라우드 네이티브 플랫폼과 300개 이상의 애플리케이션 및 통합 기능은 Syslog 전송 도구와 같은 레거시 제품의 비효율성을 해소하고, 기술 스택 전반에서 로그 집계 프로세스를 한층 더 간소화합니다.

    3. 검색/쿼리 및 분석

    집계가 완료되면 이제 로그 데이터를 분석할 차례입니다. 간단히 말해 로그 분석이란 로그 데이터를 검토하고 이해하는 과정을 의미합니다. 로그 분석의 궁극적인 목적은 중앙화된 로그에서 유용한 분석 지표와 인사이트를 추출해 기업이 이를 체계적으로 활용할 수 있도록 돕는 데 있습니다. 로그 관리의 다른 절차와 마찬가지로, 로그 분석 역시 복잡하며 여러 계층으로 구성되어 있습니다.

    다음 섹션에서는 로그 분석과 관련된 가장 중요한 일반적인 질문 몇 가지를 살펴보겠습니다.

    로그 분석은 어떻게 작동하는가?

    분석 과정에서 로그 파일로부터 유용한 분석 데이터를 추출할 수 있도록 여러 가지 방법과 기능이 사용됩니다:

    • 정규화는 데이터를 표준 형식으로 변환하여 데이터의 무결성을 향상하도록 설계된 데이터 관리 방법론입니다.
    • 패턴 인식은 머신 러닝과 로그 분석 소프트웨어에 의존하여 어떤 로그 메시지가 관련성이 있는지, 어떤 것이 그렇지 않은지를 판단하는 것입니다. 데이터의 가치를 판단할 방법이 없다면 로그는 정보의 금광이라기보다 블랙홀에 가까울 것입니다.
    • 분류태그 지정은 데이터를 시각적으로 파악하는 데 도움을 줍니다. 이 기능은 로그 항목을 서로 다른 범주로 나누고 유사한 항목을 함께 묶어 로그 데이터를 효율적으로 검색하는 과정을 크게 단순화합니다.
    • 상관 분석은 특정 이벤트(긍정적이든 부정적이든)를 검토할 때 활용됩니다. 이 과정에서는 모든 시스템의 로그 정보를 수집해, 조사 중인 이벤트와 로그 데이터 간의 상관관계를 평가하고 식별합니다.
    lm Correlation analysis 1

    강력한 로그 쿼리를 활용해 모든 데이터 세트를 심층 분석하면 신속하게 위협을 탐지할 수 있고 성능 문제 해결 역량도 향상됩니다.

    로그 분석의 어려움은 무엇인가?

    로그는 모든 빅데이터 유형 가운데 가장 포괄적인 데이터입니다. 그만큼 세부 정보가 풍부해 비즈니스 시스템의 상태를 분석하는 데 이상적인 정보원이 됩니다. 그러나 로그 데이터의 방대한 규모와 복잡성으로 인해 분석에는 다음과 같은 여러 어려움이 따릅니다.

    • 로그 데이터는 형태가 다양하고 대부분 구조화되지 않은 상태이며 대량으로 생성되므로 관계형 데이터베이스로 분석하기가 어렵습니다.
    • 로그 형식의 불일치는 매우 흔한 문제입니다. 애플리케이션과 디바이스마다 로그 방식을 다르게 사용하기 때문에, 이를 표준화하려면 상당한 노력이 필요합니다.
    • 많은 팀이 로그 스토리지를 적절한 규모로 관리하는 데 어려움을 겪습니다. 빠르게 누적되는 로그 파일은 클라우드 스토리지 비용 급증으로 이어질 수 있습니다.

    대규모 데이터 세트를 위한 도구는 이러한 과제를 해결합니다. 예를 들어 Sumo Logic 의 경우, 사용하기 쉬운 자동화 플랫폼을 통해 실시간 분석을 제공하여 로그 데이터를 신속하게 검토할 수 있도록 지원합니다. 복잡하고 시간이 많이 소요되는 설치나 업그레이드가 필요 없으며, 하드웨어나 스토리지를 관리하고 확장할 필요도 없습니다.

    로그 분석 실무를 개선하려면 어떻게 해야 하는가?

    로그 분석의 이점은 매우 인상적입니다. 그러나 앞서 언급한 과제를 해결하지 못하면, 결국 실행으로 이어질 수 없는 데이터만 쌓이게 됩니다. 로그 관리 프로세스와 로그 파일 분석에서 진정한 가치를 얻기 위해서는 로그 데이터를 최적화해야 합니다.

    로그 분석기와 기타 로그 관리 도구를 활용하면 이러한 프로세스를 최적화하고 로그 데이터에서 의미 있는 인사이트를 확보할 수 있습니다. 이러한 도구를 도입하면 개발자, 보안팀, 운영팀이 모든 비즈니스 애플리케이션을 원활하게 모니터링하고 로그 데이터를 시각화하여 더 많은 맥락을 파악할 수 있습니다.

    4. 모니터링 및 경고 알림

    분석이 끝나면 모니터링 및 알림 단계로 넘어갈 수 있습니다. 그렇다면 로그 모니터링의 목적은 무엇일까요? 로그 데이터를 모니터링하면 상황 인식을 유지할 수 있습니다. 로그 파일에서 수집되는 다양한 정보는 시스템 성능 모니터링을 포함해 여러 프로세스에 활용될 수 있습니다. 로그 분석 단계를 거친 이후, IT 팀이 비효율과 오류가 반복적으로 발생하는 지점을 파악하면, 적절한 채널을 통해 관련자 모두에게 알림을 전달하도록 알림 규칙을 설정할 수 있습니다. 로그 모니터링 절차는 시스템의 상태를 평가하고, 잠재적 위험을 식별하며, 보안 침해를 예방하는 역할을 합니다.

    5. 보고 및 대시보드

    수집, 분석, 모니터링을 완료한 후에는 진행 상황과 분석 결과를 보고할 차례입니다. 이는 로그 관리 프로세스 전반에서 발견된 중요한 데이터와 지표를 시각화하는 과정을 포함합니다. 보고 및 대시보딩의 목표는 다음과 같습니다.

    1. 표준 대시보드는 빠르게 시작하는 데 도움이 되지만, 실제 사용 사례에 기반한 구체적인 분석을 위해서는 사용자 지정 대시보드를 활용합니다.
    2. 기밀 보안 로그 및 기타 민감한 정보에 안전하게 접근할 수 있도록 합니다.
    3. 로그 관리 프로세스를 통해 도출된 인사이트를 모든 의사 결정자와 이해관계자가 이해할 수 있도록 합니다.

    로그 관리 정책이란 무엇인가?

    로그 관리 정책은 로그 데이터의 생성, 수집, 저장, 분석, 보고에 대한 지침과 프로세스를 정의합니다. 이 정책은 조직 전체 IT 환경을 포괄해야 하며, 로그 데이터와 상호 작용하는 모든 구성원을 대상으로 명확한 지침을 제공해야 합니다.

    성공적인 로그 관리 정책을 수립하려면 기업은 다음 사항을 고려해야 합니다:

    • 비교적 단순하고 확장 가능하게 설계합니다.지나치게 복잡하거나 경직된 요구 사항은 쉽게 간과될 수 있습니다.
    • 로그 수준 사용 및 스토리지 한계를 이해하고 이에 맞게 계획해야 합니다.
    • 모든 관련 규제를 검토하고, 규정 준수를 촉진하는 지침을 마련해야 합니다. 이는 누가 어떤 데이터에 접근할 수 있는지를 결정하고, 적절한 RBAC 매개변수를 설정하는 데에도 도움이 됩니다.

    로깅 정책 예시: NIST 800-53 로깅 및 모니터링 정책

    NIST 800-53은 미국국립표준기술연구소(NIST)에서 제정한 북미 지역의 사이버 보안 표준이자 규정 준수 프레임워크입니다. 연방 기관만이 NIST 800-53 규정을 의무적으로 준수해야 하지만, 어떤 기업이든 유사한 정책 체계를 채택할 수 있습니다.

    NIST 800-53의 로깅 요구 사항과 규제는 특별 간행물(SP) 800-82에 정의되어 있습니다. 로그 관리 표준인 SP 800-82는 “기업 전반에 걸쳐 효과적인 로그 관리 관행을 개발, 구현, 유지하기 위한 실질적이고 현실적인 지침을 제공합니다.” 해당 간행물 전반에서는 다음과 같은 개념에 대한 지침이 제시됩니다.

    • 로그 관리 인프라
    • 로그 관리 계획
    • 로그 관리 운영 프로세스

    물론 SP 800-82만이 유일한 로그 관리 정책은 아닙니다. 많은 국가에서 로그 관리 프로세스를 규제하기 위해 각자 고유한 정책과 방법을 마련해 왔습니다. 예를 들어, 영국에서는 법무부국가 사이버 보안 센터가 함께 로그 관리 정책 수립에 관여하고 있습니다.

    로그 관리 도구란 무엇인가?

    기업이 점점 더 방대해지는 기술 스택과 급격히 증가하는 로그 데이터를 다루기 위해서는, 이러한 모든 정보를 처리하고 관리할 수 있는 시스템이 필수적입니다. 개념적으로 볼 때, 로그 관리 도구는 시스템의 전반적인 상태와 운영 성능에 대해 포괄적이면서도 실행 가능한 인사이트를 제공합니다. 또한 규정 준수를 유지하는 동시에 운영, 보안, 비즈니스 인사이트를 생성할 수 있도록 로그 관리 관련 프로세스를 자동화합니다. 최근에는 비(非) IT 팀도 쉽게 사용할 수 있도록 로그 관리 시스템의 사용성을 높이려는 움직임이 두드러지고 있습니다. 이는 조직 전반의 협업과 커뮤니케이션을 강화하는 데 기여합니다.

    미시적인 관점에서 로그 관리 도구의 주요 기능은 다음과 같습니다:

    • 데이터 정제 기능
    • 로그 집계
    • 자동화된 로그 검색 및 모니터링
    • 쿼리 언어 기반 검색
    • 로그 보관 및 인덱싱
    • 자동 파싱
    • 추세 및 카운트 기반 경고 알림

    많은 기업이 이러한 기본 기능을 넘어서는 로그 관리 및 분석 시스템을 필요로 합니다. Sumo Logic은 다음과 같은 다양한 기능을 통해 한층 뛰어난 경험을 제공합니다.

    • 실시간 분석
    • 데이터 사일로를 제거하기 위한 단일 소스 솔루션
    • 통합된 옵저버빌리티와 보안
    • 확장성이 뛰어난 로그 분석
    • 클라우드 네이티브 분산 아키텍처
    • 유연하고 비용 효율적인 라이선싱
    • 엔터프라이즈급의 안전한 멀티 테넌트 아키텍처
    • 즉시 확장 가능한 분석 기능
    • 기본 제공 표준 대시보드 및 사용자 지정 가능한 대시보드
    • 통합 풀스택 기능

    로그 관리 모범 사례 더 알아보기