2026. 3. 18. 10:05ㆍCertifications/빅데이터분석기사 필기
다음 혼동행렬 정보를 이용하여
Accuracy, Precision, Recall, Specificity, F1 Score를 구하시오.
✔️ 예제 상황
- 어떤 이진 분류 모델의 예측 결과가 다음과 같다고 가정한다.
TP = 50 TN = 90 FP = 10 FN = 25
✔️ 의미 해석
실제 Positive를 Positive로 맞춘 경우 = 50 실제 Negative를 Negative로 맞춘 경우 = 90 실제 Negative를 Positive로 잘못 예측한 경우 = 10 실제 Positive를 Negative로 잘못 예측한 경우 = 25
이 문제에서는 위 값을 바탕으로
혼동행렬의 핵심 성능 지표를 직접 계산하는 과정을 단계별로 정리한다.
1️⃣ 혼동행렬로 정리
| 실제 \ 예측 | Positive | Negative |
|---|---|---|
| Positive | 50 | 25 |
| Negative | 10 | 90 |
2️⃣ 정확도 (Accuracy)
✅ 공식
$$
Accuracy = \frac{TP + TN}{TP + TN + FP + FN}
$$
✅ 계산 과정
$$
Accuracy = \frac{50 + 90}{50 + 90 + 10 + 25}
= \frac{140}{175}
= 0.8
$$
✅ 결과
- Accuracy = 0.8 (80%)
- 전체 데이터 중 80%를 올바르게 예측
3️⃣ 정밀도 (Precision)
✅ 공식
$$
Precision = \frac{TP}{TP + FP}
$$
✅ 계산 과정
$$
Precision = \frac{50}{50 + 10}
= \frac{50}{60}
\approx 0.8333
$$
✅ 결과
- Precision ≈ 0.8333 (83.33%)
- 예측 Positive 중 실제 Positive 비율
4️⃣ 재현율 (Recall / Sensitivity)
✅ 공식
$$
Recall = \frac{TP}{TP + FN}
$$
✅ 계산 과정
$$
Recall = \frac{50}{50 + 25}
= \frac{50}{75}
\approx 0.6667
$$
✅ 결과
- Recall ≈ 0.6667 (66.67%)
- 실제 Positive 중 얼마나 찾아냈는지
5️⃣ 특이도 (Specificity)
✅ 공식
$$
Specificity = \frac{TN}{TN + FP}
$$
✅ 계산 과정
$$
Specificity = \frac{90}{90 + 10}
= \frac{90}{100}
= 0.9
$$
✅ 결과
- Specificity = 0.9 (90%)
- 실제 Negative를 정확히 맞춘 비율
6️⃣ F1 Score
✅ 공식
$$
F1 = 2 \times \frac{Precision \times Recall}{Precision + Recall}
$$
✅ 계산 과정
$$
F1 = 2 \times \frac{0.8333 \times 0.6667}{0.8333 + 0.6667}
$$
$$
= 2 \times \frac{0.5555}{1.5}
= 2 \times 0.3703
= 0.7407
$$
✅ 결과
- F1 Score ≈ 0.7407 (74.07%)
- Precision과 Recall을 함께 고려한 종합 성능
7️⃣ 최종 결과 정리
| 지표 | 값 | 의미 |
|---|---|---|
| Accuracy | 0.8000 | 전체 중 80% 정답 |
| Precision | 0.8333 | 예측 Positive 중 83.33% 정답 |
| Recall | 0.6667 | 실제 Positive 중 66.67% 탐지 |
| Specificity | 0.9000 | 실제 Negative 중 90% 정답 |
| F1 Score | 0.7407 | 정밀도·재현율 균형 |
📊 시험 포인트 정리
- 혼동행렬 문제 → TP / TN / FP / FN 정확히 구분
- Accuracy → 전체 기준 지표
- Precision → FP 영향
- Recall → FN 영향
- Specificity → Negative 판별 능력
- F1 Score → Precision + Recall 종합 지표
'Certifications > 빅데이터분석기사 필기' 카테고리의 다른 글
| 데이터 비식별화 기법 (k-익명성 / l-다양성 / t-근접성) (0) | 2026.03.21 |
|---|---|
| 앙상블(Ensemble)·배깅(Bagging)·부스팅(Boosting) 정리 (1) | 2026.03.20 |
| 분류 성능 평가 지표 (혼동행렬 · 정확도 · 정밀도 · 재현율 · F1 · ROC · AUC) (0) | 2026.03.18 |
| [이기적] 분석결과 보고서 작성 (분석결과 적용 · 보고 · 모니터링 · 리모델링 정리) (0) | 2026.03.15 |
| [이기적] 공간 시각화 정리 (지도 시각화·단계구분도·카토그램) (0) | 2026.03.15 |