8.70 t 검정과 분산 분석(ANOVA)
1. t 검정의 개요
t 검정(t-test)은 정규 분포를 따르는 모집단의 평균에 대한 가설 검정 방법이다. 모집단 분산이 미지일 때 표본 분산을 이용하며, 검정 통계량이 t 분포를 따른다.
2. 단일 표본 t 검정(One-Sample t-test)
2.1 가설
H_0: \mu = \mu_0 \quad \text{vs.} \quad H_1: \mu \neq \mu_0 \; (\text{or } >, <)
2.2 검정 통계량
t = \frac{\bar{X} - \mu_0}{S/\sqrt{n}}
여기서 \bar{X}는 표본 평균, S는 표본 표준 편차, n은 표본 크기이다. H_0하에서 t 통계량은 자유도 n - 1의 t 분포를 따른다.
2.3 적용 조건
- 표본이 정규 분포로부터 추출되거나 n이 충분히 크다(CLT에 의한 근사)
- 모집단 분산이 미지이다
3. 이표본 t 검정(Two-Sample t-test)
3.1 독립 이표본 t 검정
두 독립 모집단의 평균 차이를 검정한다.
H_0: \mu_1 = \mu_2 \quad \text{vs.} \quad H_1: \mu_1 \neq \mu_2
등분산 가정(pooled variance):
t = \frac{\bar{X}_1 - \bar{X}_2}{S_p\sqrt{1/n_1 + 1/n_2}}
S_p^2 = \frac{(n_1 - 1)S_1^2 + (n_2 - 1)S_2^2}{n_1 + n_2 - 2}
자유도: n_1 + n_2 - 2.
이분산 가정(Welch’s t-test):
t = \frac{\bar{X}_1 - \bar{X}_2}{\sqrt{S_1^2/n_1 + S_2^2/n_2}}
자유도는 웰치-새터쓰웨이트(Welch-Satterthwaite) 근사로 계산된다.
3.2 대응 표본 t 검정(Paired t-test)
쌍으로 이루어진 관측 (X_i, Y_i)의 차이 D_i = X_i - Y_i에 대한 단일 표본 t 검정이다.
t = \frac{\bar{D}}{S_D/\sqrt{n}}
쌍 내의 상관을 이용하여 검정력을 향상시킨다.
4. 분산 분석(ANOVA)
4.1 ANOVA의 개요
분산 분석(Analysis of Variance, ANOVA)은 k \geq 3개 그룹의 평균을 동시에 비교하는 방법이다. t 검정의 다중 적용은 제1종 오류를 누적시키므로, ANOVA가 통합적 접근을 제공한다.
4.2 가설
H_0: \mu_1 = \mu_2 = \cdots = \mu_k
H_1: \text{적어도 하나의 } \mu_i \text{가 다름}
4.3 F 통계량
총 변동(SST)을 그룹 간 변동(SSB)과 그룹 내 변동(SSW)으로 분해한다.
\text{SST} = \text{SSB} + \text{SSW}
\text{SSB} = \sum_{i=1}^{k}n_i(\bar{X}_i - \bar{X})^2, \quad \text{SSW} = \sum_{i=1}^{k}\sum_{j=1}^{n_i}(X_{ij} - \bar{X}_i)^2
F 통계량:
F = \frac{\text{SSB}/(k - 1)}{\text{SSW}/(N - k)} = \frac{\text{MSB}}{\text{MSW}}
H_0하에서 F \sim F_{k-1, N-k}이다. F가 크면 그룹 간 차이가 유의하다.
4.4 ANOVA의 가정
- 정규성: 각 그룹의 데이터가 정규 분포
- 등분산성: 모든 그룹의 분산이 같음
- 독립성: 관측이 독립
5. 사후 검정(Post-Hoc Tests)
ANOVA가 H_0를 기각하면 어떤 그룹이 서로 다른지를 결정하기 위해 사후 검정을 수행한다.
- 투키의 HSD: 쌍별 비교, 가족 단위 오류율 제어
- 본페로니 보정: 다중 비교에서의 유의 수준 조정
- 던켄 검정, 셰페 검정: 다른 사후 검정 절차
6. 이원 ANOVA
두 요인(factor)이 있는 경우의 ANOVA이다. 예: 로봇 종류(요인 1) × 환경 조건(요인 2)에 따른 성능 차이.
\text{SST} = \text{SSA} + \text{SSB} + \text{SSAB} + \text{SSE}
주효과(main effect) SSA, SSB와 상호작용 효과(interaction) SSAB를 분리하여 검정한다.
7. 로봇 공학에서의 t 검정과 ANOVA
7.1 센서 성능 비교
두 센서의 평균 정밀도를 비교하는 이표본 t 검정, 또는 다수 센서 모델의 비교에 ANOVA를 사용한다.
7.2 알고리즘 성능 평가
서로 다른 제어 알고리즘, 경로 계획 방법, 학습 알고리즘의 성능(성공률, 실행 시간, 에너지 소비 등) 차이를 ANOVA로 검정한다.
7.3 반복 측정 ANOVA
동일 로봇을 다양한 조건에서 반복 측정한 데이터에 대해 반복 측정 ANOVA(Repeated Measures ANOVA)가 적용된다. 대응 구조를 활용하여 검정력을 향상시킨다.
7.4 실험 설계
요인 실험 설계(factorial design)에서 여러 설계 변수의 효과를 동시에 평가할 때 ANOVA가 핵심 도구이다.
8. 참고 문헌
- Casella, G., & Berger, R. L. (2002). Statistical Inference (2nd ed.). Duxbury.
- Montgomery, D. C. (2017). Design and Analysis of Experiments (9th ed.). Wiley.
- Wasserman, L. (2004). All of Statistics: A Concise Course in Statistical Inference. Springer.
version: 1.0