[이기적] 가설검정 완전 정리 (귀무가설·대립가설 / 유의수준 / p-value / 1종·2종 오류)
2026. 3. 11. 01:20ㆍCertifications/빅데이터분석기사 필기
1️⃣ 가설검정(Hypothesis Testing)
✅ 정의
- 모집단의 특성에 대한 가설을 설정
- 표본 데이터를 이용하여 가설의 타당성을 검정하는 통계적 방법
🎯 포인트
- 표본 데이터를 기반으로 판단
- 확률적 판단 과정
- 추론통계의 핵심 기법
2️⃣ 가설의 종류
- 가설검정에서는 두 가지 가설을 설정
| 구분 | 설명 | 예시 |
|---|---|---|
|
귀무가설 (Null Hypothesis, H₀) |
기존 주장 또는 차이가 없다는 가설 통계 검정의 기준이 되는 가설 |
H₀ : μ = μ₀ |
|
대립가설 (Alternative Hypothesis, H₁) |
귀무가설에 대립되는 가설 연구자가 입증하려는 가설 |
H₁ : μ ≠ μ₀ H₁ : μ > μ₀ H₁ : μ < μ₀ |
3️⃣ 가설검정의 절차
- 가설검정은 일반적으로 다음 절차로 진행됨
| 단계 | 내용 |
|---|---|
| ① 가설 설정 | 귀무가설(H₀)과 대립가설(H₁)을 설정 |
| ② 유의수준 설정 | 유의수준(α)을 설정하여 기각 기준을 결정 |
| ③ 검정통계량 계산 | 표본 데이터를 이용하여 검정통계량을 계산 |
| ④ 기각역 설정 | 유의수준에 따라 기각역(Critical Region)을 설정 |
| ⑤ 의사결정 | 검정통계량 또는 p-value를 통해 귀무가설 기각 여부 판단 |
✅ 1. 가설 설정
- 검정하려는 모집단 특성에 대해 귀무가설(H₀) 과 대립가설(H₁) 을 설정한다.
🔹 예시
H₀ : μ = μ0
H₁ : μ ≠ μ0✅ 2. 유의수준 설정
- 유의수준(Significance Level, α)
- 귀무가설이 참인데도 잘못 기각할 확률
| 유의수준 (α) | 의미 |
|---|---|
| 0.10 | 90% 신뢰수준 |
| 0.05 | 95% 신뢰수준 |
| 0.01 | 99% 신뢰수준 |
🎯 포인트
- α = 0.05 (가장 많이 사용하는 유의수준)
- 유의수준 α = 제1종 오류(Type I Error) 확률
✅ 3. 검정통계량 계산
- 표본 데이터를 이용하여 검정통계량(Test Statistic) 을 계산
🔹 대표적인 검정통계량
| 검정 방법 | 사용 분포 |
|---|---|
| Z 검정 | 표준정규분포 |
| t 검정 | t 분포 |
| χ² 검정 | 카이제곱 분포 |
| F 검정 | F 분포 |
✅ 4. 기각역 설정
- 유의수준에 따라 기각역(Critical Region) 결정
- 기각역에 들어가면 귀무가설 기각
🔹 예시
|Z| ≥ Zα/2 → H₀ 기각✅ 5. 의사결정
| 결과 | 의미 |
|---|---|
| H₀ 기각 | 대립가설(H₁) 채택 |
| H₀ 채택 | 귀무가설 유지 |
🎯 포인트
- p-value ≤ α → H₀ 기각
- p-value > α → H₀ 채택
4️⃣ p-value
✅ 정의
- p-value 는 관측된 데이터가 귀무가설 하에서 나타날 확률
- p-value = 귀무가설이 참일 때 현재와 같은 결과가 나올 확률
🔹 판단 기준
| 조건 | 결론 |
|---|---|
| p-value ≤ α | 귀무가설(H₀) 기각 |
| p-value > α | 귀무가설(H₀) 채택 |
🎯 포인트
- p-value가 작다 → 귀무가설이 맞을 가능성이 낮다 → H₀ 기각
5️⃣ 제1종 오류와 제2종 오류
- 가설검정에서는 두 가지 오류 가능성이 존재
| 실제 상황 | H₀ 채택 | H₀ 기각 |
|---|---|---|
| H₀ 참 | 정상 | 제1종 오류 |
| H₀ 거짓 | 제2종 오류 | 정상 |
🔹 제1종 오류 (Type I Error)
- 귀무가설이 참인데 기각
- 발생 확률 → α
🔹 제2종 오류 (Type II Error)
- 귀무가설이 거짓인데 채택
- 발생 확률 → β
🎯 포인트
Type I Error → α
Type II Error → β6️⃣ 양측검정과 단측검정
| 검정 유형 | 설명 | 대립가설 예시 |
|---|---|---|
| 양측검정 (Two-sided Test) |
평균이 특정 값과 다른지 양쪽 방향 모두 검정 | H₁ : μ ≠ μ₀ |
| 단측검정 - 우측검정 | 평균이 특정 값보다 큰지 검정 | H₁ : μ > μ₀ |
| 단측검정 - 좌측검정 | 평균이 특정 값보다 작은지 검정 | H₁ : μ < μ₀ |
📊 시험 포인트 정리
🔥 1. 귀무가설 / 대립가설 구분 ⭐
| 구분 | 의미 |
|---|---|
| 귀무가설 (H₀) | 기존 상태를 가정하는 가설 |
| 대립가설 (H₁) | 연구자가 주장하는 가설 |
🔥 2. 유의수준 의미 ⭐
- 귀무가설이 참인데 기각할 확률
→ 제1종 오류(Type I Error)의 확률
🔥 3. p-value 해석 ⭐
| 조건 | 결론 |
|---|---|
| p-value ≤ α | H₀ 기각 |
| p-value > α | H₀ 채택 |
🔥 4. 오류 개념 ⭐
| 오류 | 의미 |
|---|---|
| 제1종 오류 (Type I Error) | H₀가 참인데 기각하는 오류 |
| 제2종 오류 (Type II Error) | H₀가 거짓인데 채택하는 오류 |
🔥 5. 검정 종류 출제 포인트 ⭐
| 검정 | 사용 목적 |
|---|---|
| Z 검정 | 평균 검정 |
| t 검정 | 평균 검정 |
| χ² 검정 | 분산 / 독립성 검정 |
| F 검정 | 분산 비교 검정 |
📌 암기 핵심 요약
가설검정은 표본 데이터를 이용해 모집단에 대한 가설의 타당성을 검증하는 통계 방법

2026 이기적 빅데이터분석기사 필기 기본서
(저자: 나홍석, 배원성, 이건길, 이혜영 | 출판사: 영진닷컴)
※ 본 글은 위 교재를 참고하여 학습 목적으로 재정리한 내용입니다.
'Certifications > 빅데이터분석기사 필기' 카테고리의 다른 글
| [이기적] 확률분포 개요 정리 (확률변수 / 이산확률분포 / 연속확률분포 핵심 요약) (0) | 2026.03.11 |
|---|---|
| [이기적] 표본추출 방법 정리 (단순무작위추출 / 계통추출 / 층화추출 / 군집추출) (0) | 2026.03.11 |
| [이기적] 데이터 탐색(EDA) 개요 정리 (EDA / 산포도 / 히스토그램 / 박스플롯) (0) | 2026.03.09 |
| [이기적] 이상값(Outlier) 처리 방법 정리 (Box Plot · Z-score · DBSCAN · Isolation Forest) (0) | 2026.03.09 |
| [이기적] 결측값 처리 방법 정리 (MCAR / MAR / NMAR / 대치법) (0) | 2026.03.08 |