8.67 통계적 가설 검정의 기초

1. 가설 검정의 개념

통계적 가설 검정(statistical hypothesis testing)은 표본 데이터에 기반하여 모집단에 대한 주장(가설)의 타당성을 평가하는 통계적 추론 방법이다. 데이터와 가설 사이의 일치도를 정량적으로 측정하여, 가설을 기각(reject)할지 유지(fail to reject)할지를 결정한다.

2. 귀무 가설과 대립 가설

2.1 귀무 가설(Null Hypothesis) $H_0$

기각하고자 하는 또는 “기본 상태(status quo)“를 나타내는 가설이다. 통상 “효과 없음”, “차이 없음”, “특정 값과 같음” 등의 형태를 갖는다.

2.2 대립 가설(Alternative Hypothesis) $H_1$

귀무 가설과 반대되는 가설로, 연구자가 주장하려는 내용이다.

예: 새 센서의 평균 오차가 기존 센서와 같은지를 검정하는 문제:

$H_0: \mu_{new} = \mu_{old}$ (차이 없음)
$H_1: \mu_{new} \neq \mu_{old}$ (차이 있음, 양측 검정)

3. 검정 통계량(Test Statistic)

관측 데이터로부터 계산되는 통계량으로, 귀무 가설하에서의 분포가 알려진 양이다.

예: 정규 분포 평균 검정에서 $z$ 통계량:

$z = \frac{\bar{X} - \mu_0}{\sigma/\sqrt{n}}$

$H_0$ 하에서 $z \sim \mathcal{N}(0, 1)$ 이다.

4. 유의 수준과 기각역

4.1 유의 수준(Significance Level) $\alpha$

귀무 가설이 참일 때 이를 잘못 기각할 확률의 상한이다. 통상 $\alpha = 0.05$ 또는 $\alpha = 0.01$ 로 설정한다.

4.2 기각역(Rejection Region)

검정 통계량이 이 영역에 속하면 $H_0$ 를 기각한다. 유의 수준 $\alpha$ 에 의해 결정된다.

양측 검정: $\lvert z \rvert > z_{\alpha/2}$ 이면 기각.

단측 검정: $z > z_\alpha$ 또는 $z < -z_\alpha$ 이면 기각.

5. 제1종 오류와 제2종 오류

5.1 제1종 오류(Type I Error)

$H_0$ 가 참일 때 $H_0$ 를 기각하는 오류이다. 확률은 $\alpha$ 이다.

$P(\text{Type I Error}) = P(\text{reject } H_0 \vert H_0) = \alpha$

5.2 제2종 오류(Type II Error)

$H_0$ 가 거짓일 때 $H_0$ 를 기각하지 못하는 오류이다. 확률은 $\beta$ 이다.

$P(\text{Type II Error}) = P(\text{fail to reject } H_0 \vert H_1) = \beta$

5.3 검정력(Power)

$H_1$ 이 참일 때 $H_0$ 를 올바르게 기각할 확률이다.

$\text{Power} = 1 - \beta = P(\text{reject } H_0 \vert H_1)$

검정력은 표본 크기 $n$ , 효과 크기(effect size), 유의 수준 $\alpha$ 에 의해 결정된다. 표본 크기의 결정(power analysis)은 원하는 검정력을 달성하기 위한 표본 수를 계산한다.

6. p-값(p-value)

관측된 검정 통계량보다 더 극단적인 값이 귀무 가설하에서 나타날 확률이다.

$p\text{-value} = P(\text{observed or more extreme} \vert H_0)$

해석: p-값이 $\alpha$ 이하이면 $H_0$ 를 기각한다. p-값이 작을수록 $H_0$ 에 대한 증거가 강하다.

p-값의 해석에 주의가 필요하다. p-값은 “ $H_0$ 가 참일 확률“이 아니라 “ $H_0$ 가 참이라고 가정했을 때 이런 데이터가 관측될 확률“이다.

7. 주요 검정

7.1 $z$ 검정

모집단 분산이 알려진 경우 평균의 검정. 표본 수가 충분히 크면 CLT에 의해 근사적으로 적용 가능.

7.2 $t$ 검정

모집단 분산이 미지인 경우 평균의 검정. $t$ 분포에 기반.

단일 표본 $t$ 검정: 한 모집단 평균이 특정 값과 같은지 검정
이표본 $t$ 검정: 두 모집단 평균의 차이 검정
대응 표본 $t$ 검정: 쌍으로 이루어진 관측의 차이 검정

7.3 카이제곱 검정

적합도 검정: 관측 빈도가 이론 분포에 적합한지 검정
독립성 검정: 두 범주형 변수의 독립성 검정

7.4 F 검정

분산의 비교, ANOVA(분산 분석), 회귀 모델의 유의성 검정에 사용.

8. 로봇 공학에서의 가설 검정

8.1 센서 성능 비교

두 센서의 정밀도(분산)가 다른지 검정한다. F 검정 또는 레벤(Levene) 검정이 사용된다.

8.2 캘리브레이션 결과 검증

캘리브레이션 후 잔차가 영평균인지, 기대 분포를 따르는지 검정한다.

8.3 필터 일관성 검증

칼만 필터의 정규화된 혁신 제곱합(NIS)이 카이제곱 분포를 따르는지 검정한다. NIS 평균이 예상 값에서 유의하게 다르면 필터가 일관적이지 않다.

8.4 이상치 탐지

관측이 정상 분포의 꼬리에 속하는지 검정하여 이상치를 식별한다.

9. 참고 문헌

Casella, G., & Berger, R. L. (2002). Statistical Inference (2nd ed.). Duxbury.
Lehmann, E. L., & Romano, J. P. (2005). Testing Statistical Hypotheses (3rd ed.). Springer.
Wasserman, L. (2004). All of Statistics: A Concise Course in Statistical Inference. Springer.

version: 1.0