[이기적] 분포 시각화 정리 (히스토그램·파이차트·도넛차트·트리맵·누적그래프)

2026. 3. 14. 15:45Certifications/빅데이터분석기사 필기

1️⃣ 분포 시각화 (Distribution Visualization)

✅ 정의

  • 데이터 값이 어떤 형태로 분포되어 있는지 시각적으로 표현하는 방법
  • 데이터의 분포 특성 및 패턴을 파악하기 위한 시각화 기법

🎯 포인트

  • 데이터 값의 분포 형태 파악
  • 데이터 집중 구간 확인
  • 최소값 / 최대값 / 전체 분포 구조 파악

2️⃣ 히스토그램 (Histogram)

✅ 개념

  • 데이터를 구간(bin)으로 나누어 빈도수를 막대그래프로 표현하는 그래프
  • 데이터의 분포 형태를 확인하는 대표적인 시각화 방법

🔹 특징

  • 가로축 : 데이터 값 구간 (bin)
  • 세로축 : 빈도수 또는 개수
  • 연속형 데이터 분포 표현
  • 구간 설정에 따라 그래프 형태가 달라짐
  • 막대 간 간격 없음

🎯 시험 포인트

  • 히스토그램 = 연속형 데이터 분포
  • 구간(bin) 개념 중요
  • 막대 사이 간격 없음

3️⃣ 분포 시각화 그래프 유형

그래프 특징
원그래프
(Pie Chart)
전체 데이터를 비율(100%) 기준으로 표현
도넛차트
(Donut Chart)
파이차트 중앙을 비워 추가 정보 표현 가능
트리맵
(Tree Map)
사각형 면적으로 데이터 크기 표현, 계층 데이터 분석
누적그래프
(Stacked Chart)
여러 변수 값을 누적 형태로 표현

📊 시험 포인트 정리

🔥 1. 히스토그램

  • 연속형 데이터 분포 표현
  • 구간(bin) 설정 중요
  • 막대 간 간격 없음

🔥 2. 파이차트

  • 비율 비교
  • 전체 합 100%

🔥 3. 트리맵

  • 면적 = 데이터 값
  • 계층 구조 데이터 표현

🔥 4. 누적그래프

  • 전체 흐름 + 구성 비율 동시 표현
  • 시간 변화 데이터 분석에 활용

🔥 5. 히스토그램 vs 막대그래프

  • 히스토그램 → 연속형 데이터
  • 막대그래프 → 범주형 데이터

📌 암기 핵심 요약

시각화 목적
히스토그램 데이터 분포 확인
파이차트 비율 비교
도넛차트 비율 표현 및 추가 정보 표시
트리맵 계층 구조 데이터 표현
누적그래프 전체 값과 구성 요소 비교





2026 이기적 빅데이터분석기사 필기 기본서
(저자: 나홍석, 배원성, 이건길, 이혜영 | 출판사: 영진닷컴)

※ 본 글은 위 교재를 참고하여 학습 목적으로 재정리한 내용입니다.