분류 성능 평가 지표 (혼동행렬 · 정확도 · 정밀도 · 재현율 · F1 · ROC

분류 성능 평가 지표 (혼동행렬 · 정확도 · 정밀도 · 재현율 · F1 · ROC · AUC)

2026. 3. 18. 00:59ㆍCertifications/빅데이터분석기사 필기

1️⃣ 분류 성능 평가 개요

✅ 정의

분류 모델의 예측 결과와 실제 값을 비교하여 모델 성능을 평가하는 방법
혼동행렬(Confusion Matrix) 을 기반으로 다양한 성능 지표 계산

2️⃣ 혼동행렬 (Confusion Matrix)

✅ 개념

실제값과 예측값을 기준으로 4가지 경우로 분류한 표

✅ 구성 요소

구분	의미
TP (True Positive)	실제 Positive → 예측 Positive
TN (True Negative)	실제 Negative → 예측 Negative
FP (False Positive)	실제 Negative → 예측 Positive
FN (False Negative)	실제 Positive → 예측 Negative

✅ 구조

실제 \ 예측	Positive	Negative
Positive	TP	FN
Negative	FP	TN

🎯 포인트

TP / TN / FP / FN 위치 문제 매우 자주 출제

3️⃣ 정확도 (Accuracy)

✅ 개념

전체 데이터 중 올바르게 예측한 비율

✅ 공식

$$
Accuracy = \frac{TP + TN}{TP + TN + FP + FN}
$$

🎯 포인트

Accuracy는 데이터 불균형 상황에서 신뢰도 낮음
가장 기본 지표

4️⃣ 정밀도 (Precision)

✅ 개념

Positive로 예측한 것 중 실제로 맞은 비율

✅ 공식

$$
Precision = \frac{TP}{TP + FP}
$$

🎯 포인트

FP 감소 중요
스팸 탐지 등에서 중요

5️⃣ 재현율 / 민감도 (Recall, Sensitivity)

재현율(Recall) = 민감도(Sensitivity)와 동일 개념

✅ 개념

실제 Positive 중 올바르게 예측한 비율

✅ 공식

$$
Recall = \frac{TP}{TP + FN}
$$

🎯 포인트

FN 감소 중요
질병 진단 등에서 중요

6️⃣ 특이도 (Specificity)

✅ 개념

실제 Negative 중 올바르게 예측한 비율

✅ 공식

$$
Specificity = \frac{TN}{TN + FP}
$$

🎯 포인트

Specificity는 Recall(민감도)의 반대 개념 (음성 기준 평가)

7️⃣ F1 Score

✅ 개념

Precision과 Recall의 조화 평균

✅ 공식

$$
F1 = 2 \times \frac{Precision \times Recall}{Precision + Recall}
$$

🎯 포인트

불균형 데이터에서 중요
Precision + Recall 균형 지표

8️⃣ ROC Curve

✅ 개념

분류 임계값 변화에 따른 TPR과 FPR 관계 곡선
임계값(Threshold)에 따라 TPR, FPR이 변화하는 곡선

✅ 공식

$$
TPR = \frac{TP}{TP + FN}
$$

$$
FPR = \frac{FP}{FP + TN}
$$

🎯 포인트

ROC 곡선이 좌측 상단에 가까울수록 성능 좋음
대각선에 가까우면 성능 낮음

9️⃣ AUC (Area Under Curve)

✅ 개념

ROC 곡선 아래 면적
모델의 전체 분류 성능 평가 지표

🎯 포인트

1에 가까울수록 성능 우수
0.5 → 랜덤 수준
AUC가 클수록 모델의 분류 성능이 우수

🔟 평가 지표 비교 정리

지표	의미	핵심
Accuracy	전체 정확도	기본 지표
Precision	예측 기준 정확도	FP 감소
Recall	실제 기준 정확도	FN 감소
Specificity	음성 기준 정확도	FP 감소
F1 Score	균형 지표	Precision + Recall
AUC	전체 성능	ROC 기반

📊 시험 포인트 정리

Accuracy = 전체 맞춘 비율
Precision = 맞다고 한 것 중 진짜
Recall = 실제 중 맞춘 것
Specificity = 실제 음성 중 맞춘 것
F1 = 정밀도 + 재현율 균형

저작자표시 비영리 변경금지 (새창열림)

'Certifications > 빅데이터분석기사 필기' 카테고리의 다른 글

앙상블(Ensemble)·배깅(Bagging)·부스팅(Boosting) 정리 (1)	2026.03.20
분류 성능 평가 계산 문제 정리 (Accuracy · Precision · Recall · F1 실전 풀이) (0)	2026.03.18
[이기적] 분석결과 보고서 작성 (분석결과 적용 · 보고 · 모니터링 · 리모델링 정리) (0)	2026.03.15
[이기적] 공간 시각화 정리 (지도 시각화·단계구분도·카토그램) (0)	2026.03.15
[이기적] 비교 시각화 정리 (히트맵 · 체르노프 페이스 · 스타차트 · 평행좌표계 · 다차원척도법) (1)	2026.03.15

byelin 님의 블로그

byelin 님의 블로그

태그

최근글

댓글

공지사항

아카이브

1️⃣ 분류 성능 평가 개요

✅ 정의

2️⃣ 혼동행렬 (Confusion Matrix)

✅ 개념

✅ 구성 요소

✅ 구조

3️⃣ 정확도 (Accuracy)

✅ 개념

✅ 공식

4️⃣ 정밀도 (Precision)

✅ 개념

✅ 공식

5️⃣ 재현율 / 민감도 (Recall, Sensitivity)

✅ 개념

✅ 공식

6️⃣ 특이도 (Specificity)

✅ 개념

✅ 공식

7️⃣ F1 Score

✅ 개념

✅ 공식

8️⃣ ROC Curve

✅ 개념

✅ 공식

9️⃣ AUC (Area Under Curve)

✅ 개념

🔟 평가 지표 비교 정리

📊 시험 포인트 정리

'Certifications > 빅데이터분석기사 필기' 카테고리의 다른 글

관련글

티스토리툴바