[이기적] 가설검정 완전 정리 (귀무가설·대립가설 / 유의수준 / p-value / 1종·2종 오류)

2026. 3. 11. 01:20Certifications/빅데이터분석기사 필기

1️⃣ 가설검정(Hypothesis Testing)

✅ 정의

  • 모집단의 특성에 대한 가설을 설정
  • 표본 데이터를 이용하여 가설의 타당성을 검정하는 통계적 방법

🎯 포인트

  • 표본 데이터를 기반으로 판단
  • 확률적 판단 과정
  • 추론통계의 핵심 기법

2️⃣ 가설의 종류

  • 가설검정에서는 두 가지 가설을 설정
구분 설명 예시
귀무가설
(Null Hypothesis, H₀)
기존 주장 또는 차이가 없다는 가설
통계 검정의 기준이 되는 가설
H₀ : μ = μ₀
대립가설
(Alternative Hypothesis, H₁)
귀무가설에 대립되는 가설
연구자가 입증하려는 가설
H₁ : μ ≠ μ₀
H₁ : μ > μ₀
H₁ : μ < μ₀

3️⃣ 가설검정의 절차

  • 가설검정은 일반적으로 다음 절차로 진행됨
단계 내용
① 가설 설정 귀무가설(H₀)과 대립가설(H₁)을 설정
② 유의수준 설정 유의수준(α)을 설정하여 기각 기준을 결정
③ 검정통계량 계산 표본 데이터를 이용하여 검정통계량을 계산
④ 기각역 설정 유의수준에 따라 기각역(Critical Region)을 설정
⑤ 의사결정 검정통계량 또는 p-value를 통해 귀무가설 기각 여부 판단

✅ 1. 가설 설정

  • 검정하려는 모집단 특성에 대해 귀무가설(H₀)대립가설(H₁) 을 설정한다.

🔹 예시

H₀ : μ = μ0
H₁ : μ ≠ μ0

✅ 2. 유의수준 설정

  • 유의수준(Significance Level, α)
  • 귀무가설이 참인데도 잘못 기각할 확률
유의수준 (α) 의미
0.10 90% 신뢰수준
0.05 95% 신뢰수준
0.01 99% 신뢰수준

🎯 포인트

  • α = 0.05 (가장 많이 사용하는 유의수준)
  • 유의수준 α = 제1종 오류(Type I Error) 확률

✅ 3. 검정통계량 계산

  • 표본 데이터를 이용하여 검정통계량(Test Statistic) 을 계산

🔹 대표적인 검정통계량


검정 방법 사용 분포
Z 검정 표준정규분포
t 검정 t 분포
χ² 검정 카이제곱 분포
F 검정 F 분포

✅ 4. 기각역 설정

  • 유의수준에 따라 기각역(Critical Region) 결정
  • 기각역에 들어가면 귀무가설 기각

🔹 예시

|Z| ≥ Zα/2 → H₀ 기각

✅ 5. 의사결정

결과 의미
H₀ 기각 대립가설(H₁) 채택
H₀ 채택 귀무가설 유지

🎯 포인트

  • p-value ≤ α → H₀ 기각
  • p-value > α → H₀ 채택

4️⃣ p-value

✅ 정의

  • p-value 는 관측된 데이터가 귀무가설 하에서 나타날 확률
  • p-value = 귀무가설이 참일 때 현재와 같은 결과가 나올 확률

🔹 판단 기준


조건 결론
p-value ≤ α 귀무가설(H₀) 기각
p-value > α 귀무가설(H₀) 채택

🎯 포인트

  • p-value가 작다 → 귀무가설이 맞을 가능성이 낮다 → H₀ 기각

5️⃣ 제1종 오류와 제2종 오류

  • 가설검정에서는 두 가지 오류 가능성이 존재
실제 상황 H₀ 채택 H₀ 기각
H₀ 참 정상 제1종 오류
H₀ 거짓 제2종 오류 정상

🔹 제1종 오류 (Type I Error)

  • 귀무가설이 참인데 기각
  • 발생 확률 → α

🔹 제2종 오류 (Type II Error)

  • 귀무가설이 거짓인데 채택
  • 발생 확률 → β

🎯 포인트

Type I Error → α
Type II Error → β

6️⃣ 양측검정과 단측검정

검정 유형 설명 대립가설 예시
양측검정
(Two-sided Test)
평균이 특정 값과 다른지 양쪽 방향 모두 검정 H₁ : μ ≠ μ₀
단측검정 - 우측검정 평균이 특정 값보다 큰지 검정 H₁ : μ > μ₀
단측검정 - 좌측검정 평균이 특정 값보다 작은지 검정 H₁ : μ < μ₀

📊 시험 포인트 정리

🔥 1. 귀무가설 / 대립가설 구분 ⭐

구분 의미
귀무가설 (H₀) 기존 상태를 가정하는 가설
대립가설 (H₁) 연구자가 주장하는 가설

🔥 2. 유의수준 의미 ⭐

  • 귀무가설이 참인데 기각할 확률
    제1종 오류(Type I Error)의 확률

🔥 3. p-value 해석 ⭐

조건 결론
p-value ≤ α H₀ 기각
p-value > α H₀ 채택

🔥 4. 오류 개념 ⭐

오류 의미
제1종 오류 (Type I Error) H₀가 참인데 기각하는 오류
제2종 오류 (Type II Error) H₀가 거짓인데 채택하는 오류

🔥 5. 검정 종류 출제 포인트 ⭐

검정 사용 목적
Z 검정 평균 검정
t 검정 평균 검정
χ² 검정 분산 / 독립성 검정
F 검정 분산 비교 검정

📌 암기 핵심 요약

가설검정은 표본 데이터를 이용해 모집단에 대한 가설의 타당성을 검증하는 통계 방법





2026 이기적 빅데이터분석기사 필기 기본서
(저자: 나홍석, 배원성, 이건길, 이혜영 | 출판사: 영진닷컴)

※ 본 글은 위 교재를 참고하여 학습 목적으로 재정리한 내용입니다.