본문 바로가기
모니터링 환경 구축하기

오픈소스로 모니터링 환경 구축하기(6) - Grafana

by fiat_lux 2025. 10. 11.

Grafana란?

 

다양한 데이터 소스로부터 수집한 정보를 대시보드 형태로 시각화 하고 알람을 설정할 수 있는 오픈소스 모니터링 툴이다.

 

메트릭, 로그, 트레이스를 한 곳에서 보고
시스템의 문제를 빠르게 파악하고 분석하기 위한 시각화 허브 역할을 한다.

 


Grafana의 기능

 

1. 대시 보드 시각화

  • Prometheus에서 수집한 메트릭을 시계열 그래프 형태로 시각화한다.
  • CPU 사용량, 요청 지연 시간, 에러 율, 주문 수 같은 지표를 실시간으로 모니터링할수 있다.
  • 변수와 쿼리 템플릿을 활용해 대시보드를 동적으로 구성할 수 있다.

 

2. 로그 탐색 (Loki 연동)

  • Loki에서 수집한 로그를 Grafana UI에서 시간대, 서비스명, 로그 레벨 기준으로 검색할 수 있다.
  • 필터와 정규식 검색을 지원해 원하는 로그를 빠르게 찾아낼 수 있다.
  • 로그 라인에 trace_id 가 포함되어 있으면 클릭 한번으로 Tempo 트레이스로 이동 가능

 

3, 트레이스 분석 (Tempo 연동)

  • Tempo에 저장된 트레이스를 시각화해 요청이 시스템을 어떻게 거쳤는지 한눈에 불 수 있다.
  • 병목 구간, 예외 발생 지머, 서비스 간 호출 관계 등을 시각적으로 분석할 수 있다.
  • 특정 로그나 메트릭에서 trace_id를 기반으로 트레이스로 연결하는 탐색 흐름이 가능하다.

 

4. 알람

  • Prometheus 메트릭 기반으로 알림 규칙을 설정할 수 있다.
  • CPU 사용률이 일정 값을 초과하거나 에러율이 급증할 경우 Slack, Email, Webhook 등으로 즉시 알림을 보낼 수 있다.
  • 알림은 대시보드 인터페이스에서 규칙과 함께 통합 관리된다.

Loki + Tempo + Prometheus와 역할 분담

구성 요소 역할 Grafana에서의 역할
Prometheus 메트릭 수집 저장 메트릭 시각화, 알람 트리거
Loki 로그 수집 저장 로그 검색 및 필터링
Tempo 트레이스 저장 요청 흐름 시각화
Grafana 시각화 허브 세가지 데이터 소스를 연결해 한 화면에서 분석 가능

 

 

Prometheus, Loki, Tempo가 데이터의 생산자라면, Grafana는 그것을 하나로 묶어 보여주는 관측 포털이다.