8.8 베이즈 정리의 로봇 센서 모델링 응용

1. 센서 모델의 확률론적 표현

로봇 센서는 환경의 물리량을 측정하지만, 측정값에는 잡음, 편향, 이상치(outlier)가 포함된다. 확률론적 센서 모델은 실제 상태 $\mathbf{x}$ 가 주어졌을 때 관측 $\mathbf{z}$ 의 조건부 확률 분포 $p(\mathbf{z} \vert \mathbf{x})$ 로 표현된다. 이 조건부 분포가 베이즈 정리에서 가능도(likelihood) 역할을 수행한다.

2. 대표적 센서 모델

2.1 거리 센서(Range Sensor)

거리 센서(LiDAR, 초음파 등)의 관측 모델은 참 거리 $d^*$ 에 대해 다수의 요인을 혼합한 모델로 표현된다.

$p(z \vert d^*) = w_1 p_{hit}(z \vert d^*) + w_2 p_{short}(z \vert d^*) + w_3 p_{max}(z) + w_4 p_{rand}(z)$

여기서:

$p_{hit}$ : 정상 측정. 참 거리 주위의 가우시안 $\mathcal{N}(d^*, \sigma^2)$
$p_{short}$ : 짧은 거리 측정. 먼지, 연기 등에 의한 조기 반사
$p_{max}$ : 최대 거리 측정. 빔이 아무것도 맞추지 못한 경우
$p_{rand}$ : 무작위 측정. 균일 분포의 잡음

가중치 $w_1 + w_2 + w_3 + w_4 = 1$ 은 각 모드의 발생 빈도를 반영한다.

2.2 카메라 센서

영상 기반 인식에서 관측 모델은 물체의 클래스 $c$ 와 자세 $\mathbf{x}$ 가 주어졌을 때 영상 특징 $\mathbf{z}$ 의 조건부 확률이다.

$p(\mathbf{z} \vert c, \mathbf{x})$

심층 학습 기반 인식 시스템에서 소프트맥스(softmax) 출력이 $P(c \vert \mathbf{z})$ 로 해석되며, 이를 베이즈 정리에 의해 가능도로 변환할 수 있다.

2.3 IMU 센서

관성 측정 장치의 가속도계와 자이로스코프 관측 모델:

$\mathbf{z}_{acc} = \mathbf{R}^T(\mathbf{g} - \ddot{\mathbf{p}}) + \mathbf{b}_a + \boldsymbol{\eta}_a$

$\mathbf{z}_{gyro} = \boldsymbol{\omega} + \mathbf{b}_g + \boldsymbol{\eta}_g$

여기서 $\mathbf{b}_a, \mathbf{b}_g$ 는 편향(bias), $\boldsymbol{\eta}_a, \boldsymbol{\eta}_g$ 는 백색 잡음으로 모델링된다.

3. 베이즈 갱신에 의한 상태 추정

3.1 격자 기반 위치 추정(Grid Localization)

2차원 격자로 이산화된 위치 공간에서 각 격자 셀의 확률을 베이즈 정리로 갱신한다.

$P(\mathbf{x}_i \vert \mathbf{z}) = \eta \, p(\mathbf{z} \vert \mathbf{x}_i)P(\mathbf{x}_i)$

여기서 $P(\mathbf{x}_i)$ 는 격자 셀 $i$ 의 사전 확률, $p(\mathbf{z} \vert \mathbf{x}_i)$ 는 해당 셀에서의 센서 가능도, $\eta$ 는 정규화 상수이다.

3.2 점유 격자 지도(Occupancy Grid Map)

환경 지도의 각 셀이 점유되어 있는지 여부를 베이즈 정리로 추정한다.

$P(m_i = 1 \vert \mathbf{z}_{1:t}) = 1 - \left(1 + \frac{P(m_i = 1 \vert \mathbf{z}_t)}{1 - P(m_i = 1 \vert \mathbf{z}_t)} \cdot \frac{P(m_i = 1 \vert \mathbf{z}_{1:t-1})}{1 - P(m_i = 1 \vert \mathbf{z}_{1:t-1})} \cdot \frac{1 - P(m_i = 1)}{P(m_i = 1)}\right)^{-1}$

로그 오즈(log-odds) 표현을 사용하면 곱셈이 덧셈으로 단순화되어 효율적으로 계산된다.

$l_i^t = l_i^{t-1} + \log\frac{P(m_i \vert z_t)}{1 - P(m_i \vert z_t)} - l_0$

3.3 물체 인식에서의 분류

관측 특징 $\mathbf{z}$ 로부터 물체 클래스 $c$ 를 결정하는 문제에서 베이즈 분류기:

$c^* = \arg\max_c P(c \vert \mathbf{z}) = \arg\max_c p(\mathbf{z} \vert c)P(c)$

클래스 사전 확률 $P(c)$ 이 균일이면 최대 가능도(maximum likelihood) 분류기와 동치이다.

4. 센서 모델 파라미터의 학습

센서 모델의 파라미터(잡음 분산, 혼합 가중치 등)는 캘리브레이션 데이터로부터 학습한다.

최대 가능도 추정: 주어진 참 상태-관측 쌍 $\{(\mathbf{x}_i, \mathbf{z}_i)\}$ 에서 가능도 $\prod_i p(\mathbf{z}_i \vert \mathbf{x}_i; \boldsymbol{\theta})$ 를 최대화하는 파라미터 $\boldsymbol{\theta}$ 를 구한다.

기대-최대화(EM) 알고리즘: 혼합 모델의 파라미터를 반복적으로 추정한다. 거리 센서의 4성분 혼합 모델에서 각 관측이 어느 성분에 속하는지의 잠재 변수를 교대로 추정한다.

5. 다중 센서 융합

다수의 센서 관측 $\mathbf{z}_1, \ldots, \mathbf{z}_K$ 가 상태 $\mathbf{x}$ 가 주어졌을 때 조건부 독립이면, 베이즈 갱신은 순차적 곱셈으로 수행된다.

$p(\mathbf{x} \vert \mathbf{z}_1, \ldots, \mathbf{z}_K) \propto p(\mathbf{x}) \prod_{k=1}^{K} p(\mathbf{z}_k \vert \mathbf{x})$

각 센서의 가능도가 독립적으로 기여하므로, 센서의 추가 또는 제거가 모듈적으로 처리된다.

6. 참고 문헌

Thrun, S., Burgard, W., & Fox, D. (2005). Probabilistic Robotics. MIT Press.
Barfoot, T. D. (2017). State Estimation for Robotics. Cambridge University Press.
Bishop, C. M. (2006). Pattern Recognition and Machine Learning. Springer.
Elfes, A. (1989). “Using Occupancy Grids for Mobile Robot Perception and Navigation.” Computer, 22(6), 46–57.

version: 1.0