8.8 베이즈 정리의 로봇 센서 모델링 응용
1. 센서 모델의 확률론적 표현
로봇 센서는 환경의 물리량을 측정하지만, 측정값에는 잡음, 편향, 이상치(outlier)가 포함된다. 확률론적 센서 모델은 실제 상태 \mathbf{x}가 주어졌을 때 관측 \mathbf{z}의 조건부 확률 분포 p(\mathbf{z} \vert \mathbf{x})로 표현된다. 이 조건부 분포가 베이즈 정리에서 가능도(likelihood) 역할을 수행한다.
2. 대표적 센서 모델
2.1 거리 센서(Range Sensor)
거리 센서(LiDAR, 초음파 등)의 관측 모델은 참 거리 d^*에 대해 다수의 요인을 혼합한 모델로 표현된다.
p(z \vert d^*) = w_1 p_{hit}(z \vert d^*) + w_2 p_{short}(z \vert d^*) + w_3 p_{max}(z) + w_4 p_{rand}(z)
여기서:
- p_{hit}: 정상 측정. 참 거리 주위의 가우시안 \mathcal{N}(d^*, \sigma^2)
- p_{short}: 짧은 거리 측정. 먼지, 연기 등에 의한 조기 반사
- p_{max}: 최대 거리 측정. 빔이 아무것도 맞추지 못한 경우
- p_{rand}: 무작위 측정. 균일 분포의 잡음
가중치 w_1 + w_2 + w_3 + w_4 = 1은 각 모드의 발생 빈도를 반영한다.
2.2 카메라 센서
영상 기반 인식에서 관측 모델은 물체의 클래스 c와 자세 \mathbf{x}가 주어졌을 때 영상 특징 \mathbf{z}의 조건부 확률이다.
p(\mathbf{z} \vert c, \mathbf{x})
심층 학습 기반 인식 시스템에서 소프트맥스(softmax) 출력이 P(c \vert \mathbf{z})로 해석되며, 이를 베이즈 정리에 의해 가능도로 변환할 수 있다.
2.3 IMU 센서
관성 측정 장치의 가속도계와 자이로스코프 관측 모델:
\mathbf{z}_{acc} = \mathbf{R}^T(\mathbf{g} - \ddot{\mathbf{p}}) + \mathbf{b}_a + \boldsymbol{\eta}_a
\mathbf{z}_{gyro} = \boldsymbol{\omega} + \mathbf{b}_g + \boldsymbol{\eta}_g
여기서 \mathbf{b}_a, \mathbf{b}_g는 편향(bias), \boldsymbol{\eta}_a, \boldsymbol{\eta}_g는 백색 잡음으로 모델링된다.
3. 베이즈 갱신에 의한 상태 추정
3.1 격자 기반 위치 추정(Grid Localization)
2차원 격자로 이산화된 위치 공간에서 각 격자 셀의 확률을 베이즈 정리로 갱신한다.
P(\mathbf{x}_i \vert \mathbf{z}) = \eta \, p(\mathbf{z} \vert \mathbf{x}_i)P(\mathbf{x}_i)
여기서 P(\mathbf{x}_i)는 격자 셀 i의 사전 확률, p(\mathbf{z} \vert \mathbf{x}_i)는 해당 셀에서의 센서 가능도, \eta는 정규화 상수이다.
3.2 점유 격자 지도(Occupancy Grid Map)
환경 지도의 각 셀이 점유되어 있는지 여부를 베이즈 정리로 추정한다.
P(m_i = 1 \vert \mathbf{z}_{1:t}) = 1 - \left(1 + \frac{P(m_i = 1 \vert \mathbf{z}_t)}{1 - P(m_i = 1 \vert \mathbf{z}_t)} \cdot \frac{P(m_i = 1 \vert \mathbf{z}_{1:t-1})}{1 - P(m_i = 1 \vert \mathbf{z}_{1:t-1})} \cdot \frac{1 - P(m_i = 1)}{P(m_i = 1)}\right)^{-1}
로그 오즈(log-odds) 표현을 사용하면 곱셈이 덧셈으로 단순화되어 효율적으로 계산된다.
l_i^t = l_i^{t-1} + \log\frac{P(m_i \vert z_t)}{1 - P(m_i \vert z_t)} - l_0
3.3 물체 인식에서의 분류
관측 특징 \mathbf{z}로부터 물체 클래스 c를 결정하는 문제에서 베이즈 분류기:
c^* = \arg\max_c P(c \vert \mathbf{z}) = \arg\max_c p(\mathbf{z} \vert c)P(c)
클래스 사전 확률 P(c)이 균일이면 최대 가능도(maximum likelihood) 분류기와 동치이다.
4. 센서 모델 파라미터의 학습
센서 모델의 파라미터(잡음 분산, 혼합 가중치 등)는 캘리브레이션 데이터로부터 학습한다.
최대 가능도 추정: 주어진 참 상태-관측 쌍 \{(\mathbf{x}_i, \mathbf{z}_i)\}에서 가능도 \prod_i p(\mathbf{z}_i \vert \mathbf{x}_i; \boldsymbol{\theta})를 최대화하는 파라미터 \boldsymbol{\theta}를 구한다.
기대-최대화(EM) 알고리즘: 혼합 모델의 파라미터를 반복적으로 추정한다. 거리 센서의 4성분 혼합 모델에서 각 관측이 어느 성분에 속하는지의 잠재 변수를 교대로 추정한다.
5. 다중 센서 융합
다수의 센서 관측 \mathbf{z}_1, \ldots, \mathbf{z}_K가 상태 \mathbf{x}가 주어졌을 때 조건부 독립이면, 베이즈 갱신은 순차적 곱셈으로 수행된다.
p(\mathbf{x} \vert \mathbf{z}_1, \ldots, \mathbf{z}_K) \propto p(\mathbf{x}) \prod_{k=1}^{K} p(\mathbf{z}_k \vert \mathbf{x})
각 센서의 가능도가 독립적으로 기여하므로, 센서의 추가 또는 제거가 모듈적으로 처리된다.
6. 참고 문헌
- Thrun, S., Burgard, W., & Fox, D. (2005). Probabilistic Robotics. MIT Press.
- Barfoot, T. D. (2017). State Estimation for Robotics. Cambridge University Press.
- Bishop, C. M. (2006). Pattern Recognition and Machine Learning. Springer.
- Elfes, A. (1989). “Using Occupancy Grids for Mobile Robot Perception and Navigation.” Computer, 22(6), 46–57.
version: 1.0