분류 성능 평가 지표 (혼동행렬 · 정확도 · 정밀도 · 재현율 · F1 · ROC · AUC)
2026. 3. 18. 00:59ㆍCertifications/빅데이터분석기사 필기
1️⃣ 분류 성능 평가 개요
✅ 정의
- 분류 모델의 예측 결과와 실제 값을 비교하여 모델 성능을 평가하는 방법
- 혼동행렬(Confusion Matrix) 을 기반으로 다양한 성능 지표 계산
2️⃣ 혼동행렬 (Confusion Matrix)
✅ 개념
- 실제값과 예측값을 기준으로 4가지 경우로 분류한 표
✅ 구성 요소
| 구분 | 의미 |
|---|---|
| TP (True Positive) |
실제 Positive → 예측 Positive |
| TN (True Negative) |
실제 Negative → 예측 Negative |
| FP (False Positive) |
실제 Negative → 예측 Positive |
| FN (False Negative) |
실제 Positive → 예측 Negative |
✅ 구조
| 실제 \ 예측 | Positive | Negative |
| Positive | TP | FN |
| Negative | FP | TN |
🎯 포인트
- TP / TN / FP / FN 위치 문제 매우 자주 출제
3️⃣ 정확도 (Accuracy)
✅ 개념
- 전체 데이터 중 올바르게 예측한 비율
✅ 공식
$$
Accuracy = \frac{TP + TN}{TP + TN + FP + FN}
$$
🎯 포인트
- Accuracy는 데이터 불균형 상황에서 신뢰도 낮음
- 가장 기본 지표
4️⃣ 정밀도 (Precision)
✅ 개념
- Positive로 예측한 것 중 실제로 맞은 비율
✅ 공식
$$
Precision = \frac{TP}{TP + FP}
$$
🎯 포인트
- FP 감소 중요
- 스팸 탐지 등에서 중요
5️⃣ 재현율 / 민감도 (Recall, Sensitivity)
- 재현율(Recall) = 민감도(Sensitivity)와 동일 개념
✅ 개념
- 실제 Positive 중 올바르게 예측한 비율
✅ 공식
$$
Recall = \frac{TP}{TP + FN}
$$
🎯 포인트
- FN 감소 중요
- 질병 진단 등에서 중요
6️⃣ 특이도 (Specificity)
✅ 개념
- 실제 Negative 중 올바르게 예측한 비율
✅ 공식
$$
Specificity = \frac{TN}{TN + FP}
$$
🎯 포인트
- Specificity는 Recall(민감도)의 반대 개념 (음성 기준 평가)
7️⃣ F1 Score
✅ 개념
- Precision과 Recall의 조화 평균
✅ 공식
$$
F1 = 2 \times \frac{Precision \times Recall}{Precision + Recall}
$$
🎯 포인트
- 불균형 데이터에서 중요
- Precision + Recall 균형 지표
8️⃣ ROC Curve
✅ 개념
- 분류 임계값 변화에 따른 TPR과 FPR 관계 곡선
- 임계값(Threshold)에 따라 TPR, FPR이 변화하는 곡선
✅ 공식
$$
TPR = \frac{TP}{TP + FN}
$$
$$
FPR = \frac{FP}{FP + TN}
$$
🎯 포인트
- ROC 곡선이 좌측 상단에 가까울수록 성능 좋음
- 대각선에 가까우면 성능 낮음
9️⃣ AUC (Area Under Curve)
✅ 개념
- ROC 곡선 아래 면적
- 모델의 전체 분류 성능 평가 지표
🎯 포인트
- 1에 가까울수록 성능 우수
- 0.5 → 랜덤 수준
- AUC가 클수록 모델의 분류 성능이 우수
🔟 평가 지표 비교 정리
| 지표 | 의미 | 핵심 |
|---|---|---|
| Accuracy | 전체 정확도 | 기본 지표 |
| Precision | 예측 기준 정확도 | FP 감소 |
| Recall | 실제 기준 정확도 | FN 감소 |
| Specificity | 음성 기준 정확도 | FP 감소 |
| F1 Score | 균형 지표 | Precision + Recall |
| AUC | 전체 성능 | ROC 기반 |
📊 시험 포인트 정리
- Accuracy = 전체 맞춘 비율
- Precision = 맞다고 한 것 중 진짜
- Recall = 실제 중 맞춘 것
- Specificity = 실제 음성 중 맞춘 것
- F1 = 정밀도 + 재현율 균형
'Certifications > 빅데이터분석기사 필기' 카테고리의 다른 글
| 앙상블(Ensemble)·배깅(Bagging)·부스팅(Boosting) 정리 (1) | 2026.03.20 |
|---|---|
| 분류 성능 평가 계산 문제 정리 (Accuracy · Precision · Recall · F1 실전 풀이) (0) | 2026.03.18 |
| [이기적] 분석결과 보고서 작성 (분석결과 적용 · 보고 · 모니터링 · 리모델링 정리) (0) | 2026.03.15 |
| [이기적] 공간 시각화 정리 (지도 시각화·단계구분도·카토그램) (0) | 2026.03.15 |
| [이기적] 비교 시각화 정리 (히트맵 · 체르노프 페이스 · 스타차트 · 평행좌표계 · 다차원척도법) (1) | 2026.03.15 |