8.45 사후 분포의 계산과 갱신

1. 사후 분포의 공식

베이즈 정리에 의해 사후 분포는 다음과 같이 계산된다.

p(\boldsymbol{\theta} \vert \mathbf{z}) = \frac{p(\mathbf{z} \vert \boldsymbol{\theta})p(\boldsymbol{\theta})}{p(\mathbf{z})}

분모의 증거(evidence)는 다음과 같다.

p(\mathbf{z}) = \int p(\mathbf{z} \vert \boldsymbol{\theta})p(\boldsymbol{\theta}) \, d\boldsymbol{\theta}

증거는 \boldsymbol{\theta}에 무관한 정규화 상수이므로, 사후 분포의 형태를 결정할 때는 다음의 비례식이 주로 사용된다.

p(\boldsymbol{\theta} \vert \mathbf{z}) \propto p(\mathbf{z} \vert \boldsymbol{\theta})p(\boldsymbol{\theta})

2. 사후 분포의 계산 방법

2.1 해석적 계산(켤레 사전)

가능도와 사전이 켤레 관계에 있으면, 사후 분포가 동일한 분포족에 속하며 폐쇄형(closed-form)으로 계산된다.

가우시안 가능도 + 가우시안 사전: 평균에 대한 사후도 가우시안이다.

사전: \theta \sim \mathcal{N}(\mu_0, \sigma_0^2)
가능도: z_i \vert \theta \sim \mathcal{N}(\theta, \sigma^2), i = 1, \ldots, n
사후: \theta \vert \mathbf{z} \sim \mathcal{N}(\mu_n, \sigma_n^2)

\sigma_n^{-2} = \sigma_0^{-2} + n\sigma^{-2}

\mu_n = \sigma_n^2(\sigma_0^{-2}\mu_0 + n\sigma^{-2}\bar{z})

정밀도(분산의 역수)가 가산되고, 평균은 정밀도로 가중된 사전 평균과 표본 평균의 가중 평균이다.

베타 사전 + 이항 가능도: 사후는 베타 분포.

사전: p \sim \text{Beta}(\alpha, \beta)
가능도: k \vert p \sim \text{Bin}(n, p)
사후: p \vert k \sim \text{Beta}(\alpha + k, \beta + n - k)

2.2 수치적 계산

켤레 관계가 아닌 일반적인 경우, 사후 분포의 해석적 계산이 불가능하므로 수치 방법이 필요하다.

격자 근사(Grid Approximation): 모수 공간을 격자로 이산화하고 각 격자점에서 사후 확률을 계산한다. 저차원(p \leq 3)에서만 실용적이다.

라플라스 근사(Laplace Approximation): 사후를 MAP 주위에서 2차 테일러 전개하여 가우시안으로 근사한다.

p(\boldsymbol{\theta} \vert \mathbf{z}) \approx \mathcal{N}(\hat{\boldsymbol{\theta}}_{MAP}, \mathbf{H}^{-1})

여기서 \mathbf{H} = -\nabla^2\ln p(\boldsymbol{\theta}, \mathbf{z})\big\vert_{\hat{\boldsymbol{\theta}}_{MAP}}는 로그 사후의 헤시안 행렬이다.

마르코프 체인 몬테카를로(MCMC): 메트로폴리스-헤이스팅스(Metropolis-Hastings), 해밀토니안 몬테카를로(HMC), 깁스 샘플링 등이 사후 분포로부터의 샘플을 생성한다.

변분 추론(Variational Inference): 사후를 매개변수화된 분포족 q_\phi(\boldsymbol{\theta})로 근사하고, KL 발산을 최소화하는 \phi를 최적화한다.

3. 순차적 베이즈 갱신

관측이 순차적으로 도착할 때, 베이즈 정리의 재귀적 적용으로 사후 분포를 갱신한다.

p(\boldsymbol{\theta} \vert \mathbf{z}_{1:t+1}) \propto p(\mathbf{z}_{t+1} \vert \boldsymbol{\theta})p(\boldsymbol{\theta} \vert \mathbf{z}_{1:t})

이전 사후 p(\boldsymbol{\theta} \vert \mathbf{z}_{1:t})가 다음 갱신의 사전 역할을 한다. 이 순차적 구조는 계산 효율성을 크게 향상시킨다.

3.1 칼만 필터의 갱신

선형 가우시안 시스템에서 칼만 필터가 순차적 베이즈 갱신을 정확히 구현한다.

예측 단계:

\hat{\mathbf{x}}_t^- = \mathbf{F}\hat{\mathbf{x}}_{t-1}^+, \quad \mathbf{P}_t^- = \mathbf{F}\mathbf{P}_{t-1}^+\mathbf{F}^T + \mathbf{Q}

갱신 단계:

\mathbf{K}_t = \mathbf{P}_t^-\mathbf{H}^T(\mathbf{H}\mathbf{P}_t^-\mathbf{H}^T + \mathbf{R})^{-1}

\hat{\mathbf{x}}_t^+ = \hat{\mathbf{x}}_t^- + \mathbf{K}_t(\mathbf{z}_t - \mathbf{H}\hat{\mathbf{x}}_t^-)

\mathbf{P}_t^+ = (\mathbf{I} - \mathbf{K}_t\mathbf{H})\mathbf{P}_t^-

4. 증거와 모델 선택

사후 분포의 분모인 증거 p(\mathbf{z})는 모수에 무관하므로 사후 분포의 형태를 결정할 때는 무시되지만, 모델 비교에서는 핵심적 역할을 한다.

p(\mathbf{z} \vert M_k) = \int p(\mathbf{z} \vert \boldsymbol{\theta}, M_k)p(\boldsymbol{\theta} \vert M_k)d\boldsymbol{\theta}

두 모델의 베이즈 인자(Bayes factor):

K = \frac{p(\mathbf{z} \vert M_1)}{p(\mathbf{z} \vert M_2)}

가 모델 선택의 기준이 된다. 베이즈 인자는 복잡도와 적합도의 자연스러운 균형을 내재한다(오컴의 면도날).

5. 로봇 공학에서의 사후 분포 갱신

베이즈 필터: 상태 추정의 핵심 도구로, 순차적 관측에 대한 사후 분포의 반복적 갱신이다.

SLAM: 로봇 궤적과 지도의 결합 사후 분포를 센서 데이터로부터 갱신한다.

온라인 학습: 로봇 파라미터의 사후 분포를 새로운 데이터에 대해 점진적으로 갱신한다.

능동 감지(Active Sensing): 사후 분포의 불확실성을 최소화하는 관측 행동을 선택한다. 정보 이득(information gain)이 기준이 된다.

6. 참고 문헌

  • Bishop, C. M. (2006). Pattern Recognition and Machine Learning. Springer.
  • Gelman, A., et al. (2013). Bayesian Data Analysis (3rd ed.). CRC Press.
  • Thrun, S., Burgard, W., & Fox, D. (2005). Probabilistic Robotics. MIT Press.
  • Barfoot, T. D. (2017). State Estimation for Robotics. Cambridge University Press.

version: 1.0