[이기적] 관계 시각화 정리 (Scatter Plot · Bubble Chart · Heat Map)

2026. 3. 14. 17:31Certifications/빅데이터분석기사 필기

1️⃣ 관계 시각화(Relationship Visualization)

✅ 정의

  • 데이터 변수 간 상관관계 또는 패턴을 시각적으로 표현하는 방법
  • 데이터셋에 변수가 2개 이상 존재할 때 변수 간 관계 분석에 사용
  • 데이터 분석에서 관계 구조 탐색(EDA) 단계에서 매우 중요

🎯 포인트

  • 변수 간 상관관계 표현
  • 관계 구조 탐색
  • 대표 도구 → 산점도, 버블차트, 히트맵

2️⃣ 산점도(Scatter Plot)

✅ 개념

  • 두 변수 값을 2차원 좌표 평면에 점으로 표시하는 그래프
  • 점들의 분포를 통해 변수 간 관계 패턴을 확인할 수 있음

✅ 특징

  • 두 변수 관계 시각화의 가장 기본적인 방법
  • 점 분포를 통해 상관관계 방향(양·음) 및 강도 파악
  • 추세선을 추가하면 관계 경향 분석 가능

✅ 상관관계 유형

유형 특징
양의 상관관계 한 변수가 증가하면 다른 변수도 증가
음의 상관관계 한 변수가 증가하면 다른 변수는 감소
무상관 두 변수 간 관계 없음

✅ 활용

  • 변수 간 관계 분석
  • 데이터 패턴 탐색
  • 이상치 탐지

🎯 포인트

  • 산점도 = 두 변수 관계 시각화
  • 상관관계 판단 가능

3️⃣ 버블차트(Bubble Chart)

✅ 개념

  • 산점도에서 제3의 변수를 원의 크기로 표현한 그래프

✅ 특징

  • 3개의 변수 관계 표현 가능
요소 표현
X축 변수1
Y축 변수2
원 크기 변수3

✅ 활용

  • 도시별 인구·GDP·면적 비교
  • 국가별 경제 지표 비교
  • 시장 규모 분석

🎯 포인트

  • 버블차트 = 3개 변수 시각화
  • 원 크기로 추가 변수 표현

4️⃣ 히트맵(Heat Map)

✅ 개념

  • 데이터 값을 색상의 강도(Heat) 로 표현하는 그래프

✅ 특징

  • 데이터 값의 크기를 색상으로 표현
  • 변수 간 관계를 행렬 형태로 표현 가능
  • 패턴을 직관적으로 확인 가능

✅ 활용

  • 상관계수 행렬
  • 유전자 데이터 분석
  • 사용자 행동 패턴 분석

🎯 포인트

  • 히트맵 = 색상으로 값 표현
  • 상관계수 행렬 시각화에 많이 사용

5️⃣ 관계 시각화 비교

시각화 특징 변수 수
산점도 변수 간 관계 파악 2
버블차트 원 크기로 추가 변수 표현 3
히트맵 색으로 값 표현 다변수

🎯 포인트

  • 산점도 → 2변수 관계
  • 버블차트 → 3변수 표현
  • 히트맵 → 관계 행렬 표현

📊 시험 포인트 정리

🔥 관계 시각화 목적

  • 변수 간 관계 분석

🔥 산점도

  • 두 변수 관계 표현

🔥 버블차트

  • 산점도 확장
  • 원의 크기로 제3 변수 표현

🔥 히트맵

  • 색상으로 값 표현
  • 상관계수 행렬 시각화

📌 암기 핵심 요약

  • 두 변수 관계 시각화 → 산점도
  • 세 변수 관계 표현 → 버블차트
  • 상관계수 시각화 → 히트맵

👉 특히 산점도(2변수) vs 버블차트(3변수) 차이는 자주 출제





2026 이기적 빅데이터분석기사 필기 기본서
(저자: 나홍석, 배원성, 이건길, 이혜영 | 출판사: 영진닷컴)

※ 본 글은 위 교재를 참고하여 학습 목적으로 재정리한 내용입니다.