분류 성능 평가 지표 (혼동행렬 · 정확도 · 정밀도 · 재현율 · F1 · ROC · AUC)

2026. 3. 18. 00:59Certifications/빅데이터분석기사 필기

1️⃣ 분류 성능 평가 개요

✅ 정의

  • 분류 모델의 예측 결과와 실제 값을 비교하여 모델 성능을 평가하는 방법
  • 혼동행렬(Confusion Matrix) 을 기반으로 다양한 성능 지표 계산

2️⃣ 혼동행렬 (Confusion Matrix)

✅ 개념

  • 실제값과 예측값을 기준으로 4가지 경우로 분류한 표

✅ 구성 요소

구분 의미
TP
(True Positive)
실제 Positive → 예측 Positive
TN
(True Negative)
실제 Negative → 예측 Negative
FP
(False Positive)
실제 Negative → 예측 Positive
FN
(False Negative)
실제 Positive → 예측 Negative

✅ 구조

실제 \ 예측 Positive Negative
Positive TP FN
Negative FP TN

🎯 포인트

  • TP / TN / FP / FN 위치 문제 매우 자주 출제

3️⃣ 정확도 (Accuracy)

✅ 개념

  • 전체 데이터 중 올바르게 예측한 비율

✅ 공식


$$
Accuracy = \frac{TP + TN}{TP + TN + FP + FN}
$$


🎯 포인트

  • Accuracy는 데이터 불균형 상황에서 신뢰도 낮음
  • 가장 기본 지표

4️⃣ 정밀도 (Precision)

✅ 개념

  • Positive로 예측한 것 중 실제로 맞은 비율

✅ 공식


$$
Precision = \frac{TP}{TP + FP}
$$


🎯 포인트

  • FP 감소 중요
  • 스팸 탐지 등에서 중요

5️⃣ 재현율 / 민감도 (Recall, Sensitivity)

  • 재현율(Recall) = 민감도(Sensitivity)와 동일 개념

✅ 개념

  • 실제 Positive 중 올바르게 예측한 비율

✅ 공식


$$
Recall = \frac{TP}{TP + FN}
$$


🎯 포인트

  • FN 감소 중요
  • 질병 진단 등에서 중요

6️⃣ 특이도 (Specificity)

✅ 개념

  • 실제 Negative 중 올바르게 예측한 비율

✅ 공식


$$
Specificity = \frac{TN}{TN + FP}
$$


🎯 포인트

  • Specificity는 Recall(민감도)의 반대 개념 (음성 기준 평가)

7️⃣ F1 Score

✅ 개념

  • Precision과 Recall의 조화 평균

✅ 공식


$$
F1 = 2 \times \frac{Precision \times Recall}{Precision + Recall}
$$


🎯 포인트

  • 불균형 데이터에서 중요
  • Precision + Recall 균형 지표

8️⃣ ROC Curve

✅ 개념

  • 분류 임계값 변화에 따른 TPR과 FPR 관계 곡선
  • 임계값(Threshold)에 따라 TPR, FPR이 변화하는 곡선

✅ 공식


$$
TPR = \frac{TP}{TP + FN}
$$

$$
FPR = \frac{FP}{FP + TN}
$$


🎯 포인트

  • ROC 곡선이 좌측 상단에 가까울수록 성능 좋음
  • 대각선에 가까우면 성능 낮음

9️⃣ AUC (Area Under Curve)

✅ 개념

  • ROC 곡선 아래 면적
  • 모델의 전체 분류 성능 평가 지표

🎯 포인트

  • 1에 가까울수록 성능 우수
  • 0.5 → 랜덤 수준
  • AUC가 클수록 모델의 분류 성능이 우수

🔟 평가 지표 비교 정리

지표 의미 핵심
Accuracy 전체 정확도 기본 지표
Precision 예측 기준 정확도 FP 감소
Recall 실제 기준 정확도 FN 감소
Specificity 음성 기준 정확도 FP 감소
F1 Score 균형 지표 Precision + Recall
AUC 전체 성능 ROC 기반

📊 시험 포인트 정리

  • Accuracy = 전체 맞춘 비율
  • Precision = 맞다고 한 것 중 진짜
  • Recall = 실제 중 맞춘 것
  • Specificity = 실제 음성 중 맞춘 것
  • F1 = 정밀도 + 재현율 균형