8.48 베이지안 추정의 순차적 갱신과 로봇 응용

1. 순차적 베이즈 갱신의 구조

로봇 시스템은 시간에 따라 관측을 순차적으로 획득하므로, 매 관측에서 사후 분포를 갱신하는 재귀적 구조가 필요하다. 순차적 베이즈 갱신은 이전 시각의 사후를 다음 시각의 사전으로 사용하여 베이즈 정리를 반복 적용한다.

$p(\boldsymbol{\theta} \vert \mathbf{z}_{1:t+1}) \propto p(\mathbf{z}_{t+1} \vert \boldsymbol{\theta}) p(\boldsymbol{\theta} \vert \mathbf{z}_{1:t})$

관측이 조건부 독립이라는 가정( $p(\mathbf{z}_{t+1} \vert \boldsymbol{\theta}, \mathbf{z}_{1:t}) = p(\mathbf{z}_{t+1} \vert \boldsymbol{\theta})$ )하에서 이 재귀 구조가 성립하며, 전체 관측 이력을 다시 처리할 필요 없이 효율적 갱신이 가능하다.

2. 베이즈 필터의 일반 형식

로봇의 상태가 시간에 따라 변화하는 경우(동적 시스템), 상태 전이 모델과 관측 모델을 포함한 베이즈 필터가 적용된다.

2.1 예측 단계(Prediction Step)

시간 $t$ 에서 $t+1$ 로의 상태 전이:

$p(\mathbf{x}_{t+1} \vert \mathbf{z}_{1:t}) = \int p(\mathbf{x}_{t+1} \vert \mathbf{x}_t, \mathbf{u}_t) p(\mathbf{x}_t \vert \mathbf{z}_{1:t}) \, d\mathbf{x}_t$

전이 확률 $p(\mathbf{x}_{t+1} \vert \mathbf{x}_t, \mathbf{u}_t)$ 은 제어 입력 $\mathbf{u}_t$ 에서의 동역학 모델이다. 예측 단계는 이전 상태에 대한 주변화이다.

2.2 갱신 단계(Update Step)

새 관측 $\mathbf{z}_{t+1}$ 에 의한 베이즈 갱신:

$p(\mathbf{x}_{t+1} \vert \mathbf{z}_{1:t+1}) \propto p(\mathbf{z}_{t+1} \vert \mathbf{x}_{t+1}) p(\mathbf{x}_{t+1} \vert \mathbf{z}_{1:t})$

관측 모델과 예측 분포의 곱이 정규화되어 갱신된 사후 분포를 제공한다.

3. 다양한 베이즈 필터의 구현

3.1 칼만 필터(Kalman Filter, KF)

선형 가우시안 시스템에 대한 베이즈 필터의 최적 해이다. 상태 전이와 관측이 모두 선형이고 잡음이 가우시안이면, 사후 분포가 정확히 가우시안이며 평균과 공분산으로 완전히 기술된다.

3.2 확장 칼만 필터(Extended Kalman Filter, EKF)

비선형 시스템을 현재 추정치 주위에서 선형화(1차 테일러 근사)하여 칼만 필터를 적용한다. 로봇 공학에서 가장 널리 사용되는 상태 추정기이다.

3.3 무향 칼만 필터(Unscented Kalman Filter, UKF)

비선형 변환의 통계량을 시그마 점(sigma point) 집합으로 근사하여 계산하는 방법이다. 선형화 없이 더 정확한 평균과 공분산 전파를 제공한다.

3.4 입자 필터(Particle Filter)

사후 분포를 가중 샘플의 경험적 분포로 근사한다. 비가우시안, 비선형, 다봉 분포를 표현할 수 있으며, 로봇의 전역 위치 추정(글로벌 위치 추정)에 효과적이다.

3.5 히스토그램 필터

상태 공간을 이산 격자로 분할하고 각 셀의 확률을 갱신한다. 소규모 이산 상태 공간에서 정확하지만, 고차원에서 계산 부담이 크다.

4. 로봇 공학에서의 응용

4.1 로봇 위치 추정(Localization)

지도가 알려진 환경에서 센서 관측으로부터 로봇의 위치를 추정한다. 로봇이 이동함에 따라 위치 분포가 예측 단계에서 확산되고, 관측 단계에서 좁아진다.

$\text{bel}(\mathbf{x}_t) = p(\mathbf{x}_t \vert \mathbf{z}_{1:t}, \mathbf{u}_{1:t})$

여기서 $\text{bel}(\mathbf{x}_t)$ 는 믿음(belief)이라 하며, 순차적으로 갱신된다.

4.2 SLAM(Simultaneous Localization and Mapping)

로봇의 궤적과 지도를 동시에 추정하는 문제에서, 결합 사후 분포 $p(\mathbf{x}_{1:t}, \mathbf{m} \vert \mathbf{z}_{1:t}, \mathbf{u}_{1:t})$ 가 순차적 베이즈 갱신으로 관리된다. EKF-SLAM, 팩스터 그래프 기반 SLAM, 입자 필터 기반 FastSLAM 등이 대표적 구현이다.

4.3 물체 추적(Object Tracking)

이동하는 물체의 위치와 속도를 센서 관측으로부터 실시간 추정한다. 다중 물체 추적에서는 데이터 연관(data association) 문제와 결합된다.

4.4 적응적 파라미터 추정

로봇의 동역학 파라미터가 시간에 따라 변화하는 경우(온도, 마모 등), 순차적 베이즈 갱신에 의해 파라미터 분포를 실시간으로 갱신한다.

4.5 능동 감지(Active Sensing)

순차적 갱신 구조에서 다음 관측의 정보 이득(information gain)을 기준으로 행동(센서 방향, 로봇 이동 등)을 선택한다. 사후 분포의 엔트로피 감소가 관측의 “가치“를 정량화한다.

5. 마르코프 가정의 역할

순차적 베이즈 갱신이 재귀적으로 성립하려면 마르코프 가정이 필요하다.

$p(\mathbf{x}_{t+1} \vert \mathbf{x}_{0:t}) = p(\mathbf{x}_{t+1} \vert \mathbf{x}_t)$

$p(\mathbf{z}_t \vert \mathbf{x}_{0:t}, \mathbf{z}_{1:t-1}) = p(\mathbf{z}_t \vert \mathbf{x}_t)$

이 가정이 위반되면(예: 색깔 잡음, 미모델된 동역학) 필터의 일관성이 저하된다. 상태 공간의 확장이나 보조 변수의 도입으로 마르코프 가정을 복원할 수 있다.

6. 참고 문헌

Thrun, S., Burgard, W., & Fox, D. (2005). Probabilistic Robotics. MIT Press.
Barfoot, T. D. (2017). State Estimation for Robotics. Cambridge University Press.
Bar-Shalom, Y., Li, X. R., & Kirubarajan, T. (2001). Estimation with Applications to Tracking and Navigation. Wiley.
Bishop, C. M. (2006). Pattern Recognition and Machine Learning. Springer.

version: 1.0