8.69 제1종 오류와 제2종 오류

1. 두 종류의 오류

통계적 가설 검정에서는 두 가지 종류의 오류가 발생할 수 있다. 이들은 귀무 가설 $H_0$ 와 대립 가설 $H_1$ 에 대한 결정과 실제 상태 사이의 불일치로 정의된다.

	$H_0$ 참	$H_1$ 참
$H_0$ 기각하지 않음	올바른 결정	제2종 오류 ( $\beta$ )
$H_0$ 기각	제1종 오류 ( $\alpha$ )	올바른 결정 (검정력 $1 - \beta$ )

2. 제1종 오류(Type I Error)

2.1 정의

$H_0$ 가 참인데 이를 잘못 기각하는 오류이다. “위양성(false positive)“이라고도 한다.

$\alpha = P(\text{Type I Error}) = P(\text{reject } H_0 \vert H_0 \text{ is true})$

유의 수준 $\alpha$ 는 제1종 오류의 최대 허용 확률이다.

2.2 실용적 의미

의학: 건강한 사람을 환자로 잘못 진단
로봇 공학: 정상 작동하는 센서를 고장으로 오판, 진짜가 아닌 이상치 탐지
통신: 신호가 없는 데 있다고 오경보(false alarm)

3. 제2종 오류(Type II Error)

3.1 정의

$H_1$ 이 참인데 $H_0$ 를 기각하지 못하는 오류이다. “위음성(false negative)“이라고도 한다.

$\beta = P(\text{Type II Error}) = P(\text{fail to reject } H_0 \vert H_1 \text{ is true})$

검정력 $1 - \beta$ 는 $H_1$ 이 참일 때 이를 올바르게 감지할 확률이다.

3.2 실용적 의미

의학: 환자를 건강한 사람으로 오진
로봇 공학: 실제 고장을 감지하지 못함, 실제 장애물을 놓침
통신: 실제 신호를 감지하지 못함(missed detection)

4. 두 오류의 상충

유의 수준 $\alpha$ 를 낮추면(기각역을 좁히면) 제1종 오류는 감소하지만, 제2종 오류 $\beta$ 가 증가한다. 반대로 $\alpha$ 를 높이면 $\beta$ 가 감소한다. 두 오류를 동시에 줄이려면 표본 크기를 증가시켜야 한다.

4.1 ROC 곡선

수신자 조작 특성(Receiver Operating Characteristic, ROC) 곡선은 다양한 임계값에서의 검출률(True Positive Rate, $1 - \beta$ )과 위양성률(False Positive Rate, $\alpha$ )을 그래프로 표시한 것이다. 커브 아래 면적(AUC)이 큰 검정기가 우수한 성능을 갖는다.

5. 오류의 비대칭성

두 오류의 실용적 비용이 동일하지 않은 경우가 많다. 로봇 공학에서 충돌 회피와 같이 제2종 오류(실제 장애물을 놓침)가 치명적이면, 제2종 오류를 최소화하는 것이 우선시되며, 그 대가로 제1종 오류(불필요한 회피 행동)가 허용된다.

5.1 비용 기반 결정

두 오류의 비용 $C_I$ , $C_{II}$ 와 사전 확률 $\pi_0 = P(H_0)$ , $\pi_1 = P(H_1)$ 을 고려한 기대 비용:

$\mathbb{E}[\text{cost}] = \alpha\pi_0 C_I + \beta\pi_1 C_{II}$

이 비용을 최소화하는 결정 규칙이 베이즈 결정 규칙이다.

6. 네이만-피어슨 보조정리(Neyman-Pearson Lemma)

고정된 유의 수준 $\alpha$ 에서 검정력 $1 - \beta$ 를 최대화하는 최적 검정의 형태를 제시한다.

정리: 단순 가설 $H_0: \boldsymbol{\theta} = \boldsymbol{\theta}_0$ 와 $H_1: \boldsymbol{\theta} = \boldsymbol{\theta}_1$ 의 검정에서, 가능도 비 검정이 가장 강력(most powerful)이다.

$\Lambda(\mathbf{x}) = \frac{p(\mathbf{x} \vert \boldsymbol{\theta}_1)}{p(\mathbf{x} \vert \boldsymbol{\theta}_0)} > k$

임계값 $k$ 는 유의 수준 $\alpha$ 를 만족하도록 결정된다.

7. 로봇 공학에서의 오류 관리

7.1 고장 감지

로봇 고장 감지에서 제1종 오류는 정상을 고장으로 오판, 제2종 오류는 고장을 놓치는 것이다. 안전이 중요하면 제2종 오류 최소화를 우선한다.

7.2 장애물 감지

센서 기반 장애물 감지에서 제2종 오류(장애물을 놓침)는 충돌로 이어질 수 있으므로 매우 위험하다. 보수적 임계값 설정이 권장된다.

7.3 이상치 제거

이상치 탐지에서 제1종 오류(정상 데이터를 이상치로 오판)는 유용한 정보의 손실, 제2종 오류(이상치를 정상으로 오판)는 추정의 왜곡을 의미한다.

8. 참고 문헌

Casella, G., & Berger, R. L. (2002). Statistical Inference (2nd ed.). Duxbury.
Lehmann, E. L., & Romano, J. P. (2005). Testing Statistical Hypotheses (3rd ed.). Springer.
Neyman, J., & Pearson, E. S. (1933). “On the Problem of the Most Efficient Tests of Statistical Hypotheses.” Philosophical Transactions of the Royal Society A, 231, 289–337.

version: 1.0