8.15 기하 분포와 음이항 분포
1. 기하 분포(Geometric Distribution)
1.1 정의
기하 분포는 성공 확률 p인 독립적 베르누이 시행을 반복할 때, 첫 번째 성공이 발생하기까지의 시행 횟수 X의 분포이다.
P(X = k) = (1-p)^{k-1}p, \quad k = 1, 2, 3, \ldots
대안적 정의로, 첫 번째 성공 이전의 실패 횟수 Y = X - 1을 사용하면:
P(Y = k) = (1-p)^k p, \quad k = 0, 1, 2, \ldots
1.2 기본 통계량
\mathbb{E}[X] = \frac{1}{p}, \quad \text{Var}(X) = \frac{1-p}{p^2}
1.3 무기억 성질(Memoryless Property)
기하 분포는 이산 분포 중 유일하게 무기억 성질을 갖는다.
P(X > m + n \vert X > m) = P(X > n)
이는 m번 실패 후에도 앞으로의 성공까지의 시행 횟수 분포가 처음과 동일함을 의미한다.
1.4 로봇 공학에서의 응용
반복 시도 문제: 로봇이 물체를 성공적으로 파지할 때까지의 시도 횟수. 각 시도의 성공 확률이 p이면 평균 1/p회의 시도가 필요하다.
패킷 전송: 무선 통신에서 성공적 전송까지의 시도 횟수. 자동 재전송 요청(ARQ) 프로토콜의 분석에 사용된다.
2. 음이항 분포(Negative Binomial Distribution)
2.1 정의
음이항 분포는 성공 확률 p인 독립적 시행에서 r번째 성공이 발생하기까지의 시행 횟수 X의 분포이다.
P(X = k) = \binom{k-1}{r-1}p^r(1-p)^{k-r}, \quad k = r, r+1, r+2, \ldots
r = 1이면 기하 분포로 환원된다. X \sim \text{NB}(r, p)로 표기한다.
2.2 대안적 매개변수화
r번째 성공 이전의 실패 횟수 Y = X - r로 정의하면:
P(Y = k) = \binom{k + r - 1}{k}p^r(1-p)^k, \quad k = 0, 1, 2, \ldots
이 형태에서 r은 양의 실수로 확장 가능하며, 이 경우 \binom{k+r-1}{k} = \frac{\Gamma(k+r)}{k!\Gamma(r)}로 일반화된다.
2.3 기본 통계량
\mathbb{E}[X] = \frac{r}{p}, \quad \text{Var}(X) = \frac{r(1-p)}{p^2}
분산이 평균보다 크므로(\text{Var}(X)/\mathbb{E}[X] = (1-p)/p > 0), 포아송 분포에서 관찰되는 등분산(\text{Var} = \mathbb{E})보다 큰 과분산(overdispersion)을 모델링할 수 있다.
2.4 독립 기하 확률 변수의 합
r개의 독립 기하 확률 변수의 합이 음이항 분포를 따른다. X_i \sim \text{Geom}(p)가 독립이면:
\sum_{i=1}^{r} X_i \sim \text{NB}(r, p)
2.5 포아송-감마 혼합으로서의 해석
음이항 분포는 포아송 분포의 비율 매개변수가 감마 분포를 따르는 혼합으로 표현된다.
X \vert \Lambda \sim \text{Pois}(\Lambda), \quad \Lambda \sim \text{Gamma}(r, \beta)
이 혼합 해석은 관측 빈도에서의 개체 간 변동(heterogeneity)을 모델링하는 데 유용하다.
3. 로봇 공학에서의 응용
목표 달성까지의 다중 단계: 로봇이 r개의 부품을 모두 성공적으로 조립하기까지의 시도 횟수. 각 부품의 조립 성공률이 p이면 총 시도 횟수가 음이항 분포를 따른다.
과분산 카운트 데이터: 센서 이벤트의 발생 빈도가 포아송보다 큰 분산을 보이는 경우, 음이항 분포가 더 적절한 모델을 제공한다.
신뢰도 분석: r번째 고장이 발생하기까지의 검사 횟수의 분포가 음이항이다.
4. 참고 문헌
- Papoulis, A., & Pillai, S. U. (2002). Probability, Random Variables, and Stochastic Processes (4th ed.). McGraw-Hill.
- Ross, S. M. (2014). A First Course in Probability (9th ed.). Pearson.
- Johnson, N. L., Kotz, S., & Kemp, A. W. (2005). Univariate Discrete Distributions (3rd ed.). Wiley.
version: 1.0