8.84 예측 단계와 갱신 단계의 확률론적 해석
1. 두 단계의 역할
재귀적 상태 추정에서 예측 단계(prediction step)와 갱신 단계(update step)는 시간의 흐름과 정보의 흐름을 각각 처리하는 두 연산이다. 예측 단계는 시스템의 동역학에 의한 상태 변화를 반영하며, 갱신 단계는 새 관측에 의한 정보 획득을 반영한다. 두 단계의 교대 수행이 베이즈 필터의 본질이다.
2. 예측 단계의 확률론적 해석
2.1 수식
\overline{\text{bel}}(\mathbf{x}_t) = \int p(\mathbf{x}_t \vert \mathbf{x}_{t-1}, \mathbf{u}_t)\text{bel}(\mathbf{x}_{t-1}) \, d\mathbf{x}_{t-1}
2.2 연산의 의미
예측 단계는 전체 확률 법칙(law of total probability)의 적용이다. 이전 시각의 상태 \mathbf{x}_{t-1}에 대한 주변화를 통해, 다음 시각의 상태 분포가 계산된다.
해석:
- 이전 상태의 각 가능한 값 \mathbf{x}_{t-1}에 대해, 전이 모델 p(\mathbf{x}_t \vert \mathbf{x}_{t-1}, \mathbf{u}_t)가 다음 상태의 분포를 제공한다.
- 이 전이 분포가 이전 믿음 \text{bel}(\mathbf{x}_{t-1})의 가중치로 가중 평균된다.
- 결과는 이전 상태의 불확실성과 동역학 잡음의 결합된 분포이다.
2.3 불확실성의 증가
예측 단계에서 상태 분포의 불확실성은 일반적으로 증가한다. 동역학 모델의 프로세스 잡음이 추가되어 분산이 확장되며, 이는 시간에 따른 시스템의 예측 불확실성의 성장을 반영한다.
2.4 확산으로서의 해석
연속 시간 극한에서 예측 단계는 확산(diffusion) 과정으로 해석된다. 상태 분포가 동역학을 따라 이동하고 확산 과정에 의해 퍼진다.
\frac{\partial p(\mathbf{x}, t)}{\partial t} = -\nabla \cdot [\mathbf{f}(\mathbf{x})p(\mathbf{x}, t)] + \frac{1}{2}\nabla^2 [\mathbf{Q}(\mathbf{x})p(\mathbf{x}, t)]
이는 포커-플랑크 방정식(Fokker-Planck equation)의 형태이다.
3. 갱신 단계의 확률론적 해석
3.1 수식
\text{bel}(\mathbf{x}_t) = \eta \, p(\mathbf{z}_t \vert \mathbf{x}_t)\overline{\text{bel}}(\mathbf{x}_t)
3.2 연산의 의미
갱신 단계는 베이즈 정리의 직접적 적용이다. 새 관측 \mathbf{z}_t에 의해 예측 분포가 사후 분포로 갱신된다.
해석:
- 예측 분포 \overline{\text{bel}}(\mathbf{x}_t)가 관측 이전의 사전 역할을 한다.
- 가능도 p(\mathbf{z}_t \vert \mathbf{x}_t)가 관측이 각 가능한 상태에서 발생할 확률을 제공한다.
- 사후 분포는 사전과 가능도의 곱으로 계산되며, 관측과 일치하는 상태의 확률이 증가하고 일치하지 않는 상태의 확률이 감소한다.
3.3 불확실성의 감소
갱신 단계에서 사후 분포의 불확실성은 일반적으로 감소한다. 새 관측에 의한 정보 획득이 상태 추정의 정밀도를 향상시킨다. 이는 정보 이론적으로 엔트로피의 감소로 해석된다.
3.4 정보 획득으로서의 해석
관측이 제공하는 정보의 양은 상호 정보(mutual information) I(\mathbf{x}_t; \mathbf{z}_t)로 측정된다. 관측이 상태와 강한 상관을 가질수록 정보량이 크고, 사후 분포가 더 집중된다.
4. 두 단계의 순환
예측과 갱신의 순환은 다음과 같이 해석된다.
- 예측: 시간 흐름에 따른 상태 변화 (엔트로피 증가 경향)
- 갱신: 관측에 의한 정보 획득 (엔트로피 감소)
이 두 효과의 균형이 필터의 안정성과 수렴 특성을 결정한다. 관측이 충분히 빈번하고 정보적이면 불확실성이 제한되고, 그렇지 않으면 불확실성이 증가한다.
5. 관측이 없는 경우
새 관측이 없으면 갱신 단계가 생략되고 예측만 수행된다. 이 경우 불확실성이 지속적으로 증가하며, 이를 추측항법(dead reckoning)이라 한다. 관측이 다시 도착하면 갱신 단계가 불확실성을 감소시킨다.
6. 다중 관측의 순차 처리
여러 관측이 동시에 도착하면(센서 융합), 조건부 독립 가정하에서 순차적으로 갱신한다.
\text{bel}(\mathbf{x}_t) \propto \overline{\text{bel}}(\mathbf{x}_t)\prod_k p(\mathbf{z}_t^{(k)} \vert \mathbf{x}_t)
각 센서의 가능도가 독립적으로 곱해져 사후 분포를 형성한다.
7. 칼만 필터에서의 구현
선형 가우시안 시스템에서 베이즈 필터의 예측과 갱신 단계는 각각 다음의 행렬 연산으로 구현된다.
예측 단계:
\hat{\mathbf{x}}_t^- = \mathbf{F}_t\hat{\mathbf{x}}_{t-1}^+ + \mathbf{B}_t\mathbf{u}_t
\mathbf{P}_t^- = \mathbf{F}_t\mathbf{P}_{t-1}^+\mathbf{F}_t^T + \mathbf{Q}_t
갱신 단계:
\mathbf{K}_t = \mathbf{P}_t^-\mathbf{H}_t^T(\mathbf{H}_t\mathbf{P}_t^-\mathbf{H}_t^T + \mathbf{R}_t)^{-1}
\hat{\mathbf{x}}_t^+ = \hat{\mathbf{x}}_t^- + \mathbf{K}_t(\mathbf{z}_t - \mathbf{H}_t\hat{\mathbf{x}}_t^-)
\mathbf{P}_t^+ = (\mathbf{I} - \mathbf{K}_t\mathbf{H}_t)\mathbf{P}_t^-
예측 단계에서 공분산 \mathbf{P}가 확장되고, 갱신 단계에서 축소된다.
8. 참고 문헌
- Thrun, S., Burgard, W., & Fox, D. (2005). Probabilistic Robotics. MIT Press.
- Barfoot, T. D. (2017). State Estimation for Robotics. Cambridge University Press.
- Bar-Shalom, Y., Li, X. R., & Kirubarajan, T. (2001). Estimation with Applications to Tracking and Navigation. Wiley.
version: 1.0