8.26 주변 확률 분포와 주변화

1. 주변 분포의 정의

주변 확률 분포(marginal probability distribution)는 결합 분포로부터 관심 없는 변수를 제거하여 특정 변수(또는 변수 부분 집합)만의 분포를 구한 것이다.

결합 분포 $p(\mathbf{x}, \mathbf{y})$ 에서 $\mathbf{y}$ 를 주변화하면:

$p(\mathbf{x}) = \int p(\mathbf{x}, \mathbf{y}) \, d\mathbf{y}$

이산 경우: $p(\mathbf{x}) = \sum_{\mathbf{y}} p(\mathbf{x}, \mathbf{y})$

이 연산을 주변화(marginalization)라 하며, “관심 없는 변수에 대해 합산(또는 적분)하여 소거“하는 것이다.

주변화는 확률의 합의 법칙의 연속적 확장이다. 조건부 분포와 결합하면 전확률 정리(law of total probability)로 귀결된다.

$p(\mathbf{x}) = \int p(\mathbf{x} \vert \mathbf{y})p(\mathbf{y}) \, d\mathbf{y}$

주변 분포는 조건부 분포의 $\mathbf{y}$ 에 대한 기대값이다.

$p(\mathbf{x}) = \mathbb{E}_{\mathbf{y}}[p(\mathbf{x} \vert \mathbf{y})]$

결합 가우시안 $[\mathbf{X}_1^T, \mathbf{X}_2^T]^T \sim \mathcal{N}(\boldsymbol{\mu}, \boldsymbol{\Sigma})$ 에서 $\mathbf{X}_2$ 를 주변화하면:

$\mathbf{X}_1 \sim \mathcal{N}(\boldsymbol{\mu}_1, \boldsymbol{\Sigma}_{11})$

가우시안의 주변 분포는 해당 변수의 평균과 공분산 부분 행렬만으로 결정되며, 추가 계산이 불필요하다. 이는 가우시안 분포의 중요한 닫힘 성질이다.

상태 추정에서 예측 단계는 이전 상태 $\mathbf{x}_t$ 에 대한 주변화이다.

$p(\mathbf{x}_{t+1} \vert \mathbf{z}_{1:t}) = \int p(\mathbf{x}_{t+1} \vert \mathbf{x}_t) p(\mathbf{x}_t \vert \mathbf{z}_{1:t}) \, d\mathbf{x}_t$

이전 상태의 모든 가능한 값에 대해 전이 확률을 가중 합산하여 다음 상태의 예측 분포를 구한다.

SLAM의 상태 벡터가 로봇 포즈 $\mathbf{x}_R$ 과 랜드마크 위치 $\mathbf{m}$ 으로 구성될 때, 특정 랜드마크만의 분포를 구하려면 나머지를 주변화한다.

$p(\mathbf{m}_i \vert \mathbf{z}_{1:t}) = \int p(\mathbf{x}_R, \mathbf{m} \vert \mathbf{z}_{1:t}) \, d\mathbf{x}_R \, d\mathbf{m}_{\setminus i}$

가우시안 분포에서 이 주변화는 공분산 행렬의 부분 행렬 추출로 수행된다.

센서 관측의 예측 분포는 상태에 대한 주변화이다.

$p(\mathbf{z}) = \int p(\mathbf{z} \vert \mathbf{x})p(\mathbf{x}) \, d\mathbf{x}$

이 적분은 관측의 가능도 평가와 이상치 탐지에 사용된다.

고차원 상태 공간에서 저차원 부분 공간으로의 불확실성 투영이 주변화에 해당한다. 6자유도 자세의 불확실성에서 위치만의 불확실성을 구하는 것이 대표적이다.

주변화의 적분이 해석적으로 풀리지 않는 경우가 대부분이며, 수치적 근사가 필요하다.

가우시안 근사: 비선형 함수의 주변화에서 무향 변환(Unscented Transform)이나 가우시안 구적법(Gauss-Hermite quadrature)이 사용된다.

몬테카를로 적분: 입자 필터(particle filter)에서 $p(\mathbf{x}_t)$ 를 가중 샘플의 경험적 분포로 근사하여 주변화를 수행한다.

정보 형식에서 변수의 주변화는 슈어 보수(Schur complement)를 이용하여 효율적으로 수행된다. 결합 정보 행렬의 구조를 활용하면 전체 역행렬을 계산하지 않고도 주변 분포를 구할 수 있다.

연산	의미	가우시안에서의 효과
주변화	변수 제거 (적분/합산)	불확실성 유지 또는 증가
조건화	변수에 값 대입 (관측)	불확실성 감소

주변화는 정보를 잃는 연산이고, 조건화는 정보를 얻는 연산이다.

Papoulis, A., & Pillai, S. U. (2002). Probability, Random Variables, and Stochastic Processes (4th ed.). McGraw-Hill.
Bishop, C. M. (2006). Pattern Recognition and Machine Learning. Springer.
Barfoot, T. D. (2017). State Estimation for Robotics. Cambridge University Press.
Thrun, S., Burgard, W., & Fox, D. (2005). Probabilistic Robotics. MIT Press.

version: 1.0