분류 성능 평가 계산 문제 정리 (Accuracy · Precision · Recall · F1 실전 풀이)

2026. 3. 18. 10:05Certifications/빅데이터분석기사 필기

📊 분류 성능 평가 계산 문제



다음 혼동행렬 정보를 이용하여
Accuracy, Precision, Recall, Specificity, F1 Score를 구하시오.



✔️ 예제 상황

  • 어떤 이진 분류 모델의 예측 결과가 다음과 같다고 가정한다.
TP = 50
TN = 90
FP = 10
FN = 25

✔️ 의미 해석

실제 Positive를 Positive로 맞춘 경우 = 50
실제 Negative를 Negative로 맞춘 경우 = 90
실제 Negative를 Positive로 잘못 예측한 경우 = 10
실제 Positive를 Negative로 잘못 예측한 경우 = 25

이 문제에서는 위 값을 바탕으로
혼동행렬의 핵심 성능 지표를 직접 계산하는 과정을 단계별로 정리한다.

1️⃣ 혼동행렬로 정리

실제 \ 예측 Positive Negative
Positive 50 25
Negative 10 90

2️⃣ 정확도 (Accuracy)

✅ 공식


$$
Accuracy = \frac{TP + TN}{TP + TN + FP + FN}
$$


✅ 계산 과정


$$
Accuracy = \frac{50 + 90}{50 + 90 + 10 + 25}
= \frac{140}{175}
= 0.8
$$


✅ 결과

  • Accuracy = 0.8 (80%)
  • 전체 데이터 중 80%를 올바르게 예측


3️⃣ 정밀도 (Precision)

✅ 공식


$$
Precision = \frac{TP}{TP + FP}
$$


✅ 계산 과정


$$
Precision = \frac{50}{50 + 10}
= \frac{50}{60}
\approx 0.8333
$$


✅ 결과

  • Precision ≈ 0.8333 (83.33%)
  • 예측 Positive 중 실제 Positive 비율

4️⃣ 재현율 (Recall / Sensitivity)

✅ 공식


$$
Recall = \frac{TP}{TP + FN}
$$


✅ 계산 과정


$$
Recall = \frac{50}{50 + 25}
= \frac{50}{75}
\approx 0.6667
$$


✅ 결과

  • Recall ≈ 0.6667 (66.67%)
  • 실제 Positive 중 얼마나 찾아냈는지


5️⃣ 특이도 (Specificity)

✅ 공식


$$
Specificity = \frac{TN}{TN + FP}
$$


✅ 계산 과정


$$
Specificity = \frac{90}{90 + 10}
= \frac{90}{100}
= 0.9
$$


✅ 결과

  • Specificity = 0.9 (90%)
  • 실제 Negative를 정확히 맞춘 비율

6️⃣ F1 Score

✅ 공식


$$
F1 = 2 \times \frac{Precision \times Recall}{Precision + Recall}
$$


✅ 계산 과정


$$
F1 = 2 \times \frac{0.8333 \times 0.6667}{0.8333 + 0.6667}
$$

$$
= 2 \times \frac{0.5555}{1.5}
= 2 \times 0.3703
= 0.7407
$$


✅ 결과

  • F1 Score ≈ 0.7407 (74.07%)
  • Precision과 Recall을 함께 고려한 종합 성능

7️⃣ 최종 결과 정리

지표 의미
Accuracy 0.8000 전체 중 80% 정답
Precision 0.8333 예측 Positive 중 83.33% 정답
Recall 0.6667 실제 Positive 중 66.67% 탐지
Specificity 0.9000 실제 Negative 중 90% 정답
F1 Score 0.7407 정밀도·재현율 균형

📊 시험 포인트 정리

  • 혼동행렬 문제 → TP / TN / FP / FN 정확히 구분
  • Accuracy → 전체 기준 지표
  • Precision → FP 영향
  • Recall → FN 영향
  • Specificity → Negative 판별 능력
  • F1 Score → Precision + Recall 종합 지표