[이기적] 가설검정 완전 정리 (귀무가설·대립가설 / 유의수준 / p-value / 1종·2종 오류)

[이기적] 가설검정 완전 정리 (귀무가설·대립가설 / 유의수준 / p-value / 1종·2종 오류)

2026. 3. 11. 01:20ㆍCertifications/빅데이터분석기사 필기

1️⃣ 가설검정(Hypothesis Testing)

✅ 정의

모집단의 특성에 대한 가설을 설정
표본 데이터를 이용하여 가설의 타당성을 검정하는 통계적 방법

🎯 포인트

표본 데이터를 기반으로 판단
확률적 판단 과정
추론통계의 핵심 기법

2️⃣ 가설의 종류

가설검정에서는 두 가지 가설을 설정

구분	설명	예시
귀무가설 (Null Hypothesis, H₀)	기존 주장 또는 차이가 없다는 가설 통계 검정의 기준이 되는 가설	H₀ : μ = μ₀
대립가설 (Alternative Hypothesis, H₁)	귀무가설에 대립되는 가설 연구자가 입증하려는 가설	H₁ : μ ≠ μ₀ H₁ : μ > μ₀ H₁ : μ < μ₀

3️⃣ 가설검정의 절차

가설검정은 일반적으로 다음 절차로 진행됨

단계	내용
① 가설 설정	귀무가설(H₀)과 대립가설(H₁)을 설정
② 유의수준 설정	유의수준(α)을 설정하여 기각 기준을 결정
③ 검정통계량 계산	표본 데이터를 이용하여 검정통계량을 계산
④ 기각역 설정	유의수준에 따라 기각역(Critical Region)을 설정
⑤ 의사결정	검정통계량 또는 p-value를 통해 귀무가설 기각 여부 판단

✅ 1. 가설 설정

검정하려는 모집단 특성에 대해 귀무가설(H₀) 과 대립가설(H₁) 을 설정한다.

🔹 예시

H₀ : μ = μ0
H₁ : μ ≠ μ0

✅ 2. 유의수준 설정

유의수준(Significance Level, α)
귀무가설이 참인데도 잘못 기각할 확률

유의수준 (α)	의미
0.10	90% 신뢰수준
0.05	95% 신뢰수준
0.01	99% 신뢰수준

🎯 포인트

α = 0.05 (가장 많이 사용하는 유의수준)
유의수준 α = 제1종 오류(Type I Error) 확률

✅ 3. 검정통계량 계산

표본 데이터를 이용하여 검정통계량(Test Statistic) 을 계산

🔹 대표적인 검정통계량

검정 방법	사용 분포
Z 검정	표준정규분포
t 검정	t 분포
χ² 검정	카이제곱 분포
F 검정	F 분포

✅ 4. 기각역 설정

유의수준에 따라 기각역(Critical Region) 결정
기각역에 들어가면 귀무가설 기각

🔹 예시

|Z| ≥ Zα/2 → H₀ 기각

✅ 5. 의사결정

결과	의미
H₀ 기각	대립가설(H₁) 채택
H₀ 채택	귀무가설 유지

🎯 포인트

p-value ≤ α → H₀ 기각
p-value > α → H₀ 채택

4️⃣ p-value

✅ 정의

p-value 는 관측된 데이터가 귀무가설 하에서 나타날 확률
p-value = 귀무가설이 참일 때 현재와 같은 결과가 나올 확률

🔹 판단 기준

조건	결론
p-value ≤ α	귀무가설(H₀) 기각
p-value > α	귀무가설(H₀) 채택

🎯 포인트

p-value가 작다 → 귀무가설이 맞을 가능성이 낮다 → H₀ 기각

5️⃣ 제1종 오류와 제2종 오류

가설검정에서는 두 가지 오류 가능성이 존재

실제 상황	H₀ 채택	H₀ 기각
H₀ 참	정상	제1종 오류
H₀ 거짓	제2종 오류	정상

🔹 제1종 오류 (Type I Error)

귀무가설이 참인데 기각
발생 확률 → α

🔹 제2종 오류 (Type II Error)

귀무가설이 거짓인데 채택
발생 확률 → β

🎯 포인트

Type I Error → α
Type II Error → β

6️⃣ 양측검정과 단측검정

검정 유형	설명	대립가설 예시
양측검정 (Two-sided Test)	평균이 특정 값과 다른지 양쪽 방향 모두 검정	H₁ : μ ≠ μ₀
단측검정 - 우측검정	평균이 특정 값보다 큰지 검정	H₁ : μ > μ₀
단측검정 - 좌측검정	평균이 특정 값보다 작은지 검정	H₁ : μ < μ₀

📊 시험 포인트 정리

🔥 1. 귀무가설 / 대립가설 구분 ⭐

구분	의미
귀무가설 (H₀)	기존 상태를 가정하는 가설
대립가설 (H₁)	연구자가 주장하는 가설

🔥 2. 유의수준 의미 ⭐

귀무가설이 참인데 기각할 확률
→ 제1종 오류(Type I Error)의 확률

🔥 3. p-value 해석 ⭐

조건	결론
p-value ≤ α	H₀ 기각
p-value > α	H₀ 채택

🔥 4. 오류 개념 ⭐

오류	의미
제1종 오류 (Type I Error)	H₀가 참인데 기각하는 오류
제2종 오류 (Type II Error)	H₀가 거짓인데 채택하는 오류

🔥 5. 검정 종류 출제 포인트 ⭐

검정	사용 목적
Z 검정	평균 검정
t 검정	평균 검정
χ² 검정	분산 / 독립성 검정
F 검정	분산 비교 검정

📌 암기 핵심 요약

가설검정은 표본 데이터를 이용해 모집단에 대한 가설의 타당성을 검증하는 통계 방법

2026 이기적 빅데이터분석기사 필기 기본서
(저자: 나홍석, 배원성, 이건길, 이혜영 | 출판사: 영진닷컴)

※ 본 글은 위 교재를 참고하여 학습 목적으로 재정리한 내용입니다.

저작자표시 비영리 변경금지 (새창열림)

'Certifications > 빅데이터분석기사 필기' 카테고리의 다른 글

[이기적] 확률분포 개요 정리 (확률변수 / 이산확률분포 / 연속확률분포 핵심 요약) (0)	2026.03.11
[이기적] 표본추출 방법 정리 (단순무작위추출 / 계통추출 / 층화추출 / 군집추출) (0)	2026.03.11
[이기적] 데이터 탐색(EDA) 개요 정리 (EDA / 산포도 / 히스토그램 / 박스플롯) (0)	2026.03.09
[이기적] 이상값(Outlier) 처리 방법 정리 (Box Plot · Z-score · DBSCAN · Isolation Forest) (0)	2026.03.09
[이기적] 결측값 처리 방법 정리 (MCAR / MAR / NMAR / 대치법) (0)	2026.03.08

byelin 님의 블로그

byelin 님의 블로그

태그

최근글

댓글

공지사항

아카이브

1️⃣ 가설검정(Hypothesis Testing)

✅ 정의

2️⃣ 가설의 종류

3️⃣ 가설검정의 절차

✅ 1. 가설 설정

✅ 2. 유의수준 설정

✅ 3. 검정통계량 계산

✅ 4. 기각역 설정

✅ 5. 의사결정

4️⃣ p-value

✅ 정의

5️⃣ 제1종 오류와 제2종 오류

🔹 제1종 오류 (Type I Error)

🔹 제2종 오류 (Type II Error)

6️⃣ 양측검정과 단측검정

📊 시험 포인트 정리

🔥 1. 귀무가설 / 대립가설 구분 ⭐

🔥 2. 유의수준 의미 ⭐

🔥 3. p-value 해석 ⭐

🔥 4. 오류 개념 ⭐

🔥 5. 검정 종류 출제 포인트 ⭐

📌 암기 핵심 요약

'Certifications > 빅데이터분석기사 필기' 카테고리의 다른 글

관련글

티스토리툴바