8.19 다변량 가우시안 분포의 정의와 성질

8.19 다변량 가우시안 분포의 정의와 성질

1. 정의

n차원 확률 벡터 \mathbf{X} = [X_1, \ldots, X_n]^T가 다변량 가우시안 분포(multivariate Gaussian distribution)를 따를 때, \mathbf{X} \sim \mathcal{N}(\boldsymbol{\mu}, \boldsymbol{\Sigma})로 표기하며, 확률 밀도 함수는 다음과 같다.

f_{\mathbf{X}}(\mathbf{x}) = \frac{1}{(2\pi)^{n/2}\lvert\boldsymbol{\Sigma}\rvert^{1/2}}\exp\left(-\frac{1}{2}(\mathbf{x} - \boldsymbol{\mu})^T\boldsymbol{\Sigma}^{-1}(\mathbf{x} - \boldsymbol{\mu})\right)

여기서 \boldsymbol{\mu} = \mathbb{E}[\mathbf{X}] \in \mathbb{R}^n은 평균 벡터, \boldsymbol{\Sigma} = \mathbb{E}[(\mathbf{X} - \boldsymbol{\mu})(\mathbf{X} - \boldsymbol{\mu})^T] \in \mathbb{R}^{n \times n}은 공분산 행렬이다. \boldsymbol{\Sigma}는 대칭 양정치(positive definite)여야 밀도 함수가 정의된다.

2. 정보 형식(Information Form)

공분산 형식의 대안으로, 정보 행렬 \boldsymbol{\Lambda} = \boldsymbol{\Sigma}^{-1}과 정보 벡터 \boldsymbol{\eta} = \boldsymbol{\Sigma}^{-1}\boldsymbol{\mu}를 사용하는 정보 형식(canonical form)이 있다.

f_{\mathbf{X}}(\mathbf{x}) \propto \exp\left(-\frac{1}{2}\mathbf{x}^T\boldsymbol{\Lambda}\mathbf{x} + \boldsymbol{\eta}^T\mathbf{x}\right)

정보 형식은 조건부 분포의 계산과 다수의 관측을 결합하는 문제에서 효율적이다. 확장 정보 필터(Extended Information Filter, EIF)와 SLAM의 정보 필터 형태에서 사용된다.

3. 주변 분포

\mathbf{X}를 두 부분벡터로 분할한다.

\mathbf{X} = \begin{bmatrix}\mathbf{X}_1 \\ \mathbf{X}_2\end{bmatrix}, \quad \boldsymbol{\mu} = \begin{bmatrix}\boldsymbol{\mu}_1 \\ \boldsymbol{\mu}_2\end{bmatrix}, \quad \boldsymbol{\Sigma} = \begin{bmatrix}\boldsymbol{\Sigma}_{11} & \boldsymbol{\Sigma}_{12} \\ \boldsymbol{\Sigma}_{21} & \boldsymbol{\Sigma}_{22}\end{bmatrix}

주변 분포(marginal distribution)는 해당 변수의 평균과 공분산 블록으로 결정된다.

\mathbf{X}_1 \sim \mathcal{N}(\boldsymbol{\mu}_1, \boldsymbol{\Sigma}_{11})

4. 조건부 분포

\mathbf{X}_2 = \mathbf{x}_2가 관측된 조건에서 \mathbf{X}_1의 조건부 분포:

\mathbf{X}_1 \vert \mathbf{X}_2 = \mathbf{x}_2 \sim \mathcal{N}(\boldsymbol{\mu}_{1\vert 2}, \boldsymbol{\Sigma}_{1\vert 2})

\boldsymbol{\mu}_{1\vert 2} = \boldsymbol{\mu}_1 + \boldsymbol{\Sigma}_{12}\boldsymbol{\Sigma}_{22}^{-1}(\mathbf{x}_2 - \boldsymbol{\mu}_2)

\boldsymbol{\Sigma}_{1\vert 2} = \boldsymbol{\Sigma}_{11} - \boldsymbol{\Sigma}_{12}\boldsymbol{\Sigma}_{22}^{-1}\boldsymbol{\Sigma}_{21}

핵심적 성질:

  • 조건부 분포도 가우시안이다.
  • 조건부 평균은 관측값의 아핀 함수이다.
  • 조건부 공분산은 관측값에 무관하다(관측 전에 미리 계산 가능).

이 성질이 칼만 필터의 갱신 단계를 가능하게 하는 수학적 기반이다.

5. 독립성과 상관

다변량 가우시안에서 비상관(uncorrelated, \boldsymbol{\Sigma}_{12} = \mathbf{0})과 독립(independent)이 동치이다. 일반적인 분포에서는 비상관이 독립을 보장하지 않지만, 가우시안에서는 이 두 조건이 동치이다.

6. 가우시안 곱 공식

두 가우시안 밀도의 곱(베이즈 갱신에서 사전과 가능도의 결합)도 가우시안이다.

\mathcal{N}(\mathbf{x}; \boldsymbol{\mu}_1, \boldsymbol{\Sigma}_1) \cdot \mathcal{N}(\mathbf{x}; \boldsymbol{\mu}_2, \boldsymbol{\Sigma}_2) \propto \mathcal{N}(\mathbf{x}; \boldsymbol{\mu}_c, \boldsymbol{\Sigma}_c)

\boldsymbol{\Sigma}_c^{-1} = \boldsymbol{\Sigma}_1^{-1} + \boldsymbol{\Sigma}_2^{-1}

\boldsymbol{\Sigma}_c^{-1}\boldsymbol{\mu}_c = \boldsymbol{\Sigma}_1^{-1}\boldsymbol{\mu}_1 + \boldsymbol{\Sigma}_2^{-1}\boldsymbol{\mu}_2

이 공식은 정보 형식에서 자연스럽게 표현되며, 칼만 필터의 갱신이 정보의 가산에 해당함을 보여 준다.

7. 로봇 공학에서의 핵심 역할

다변량 가우시안은 로봇 상태 추정의 근간이다. 로봇의 상태(위치, 자세, 속도)를 평균 벡터로, 불확실성을 공분산 행렬로 표현한다. 칼만 필터, 확장 칼만 필터(EKF), 비선형 최소 제곱에 기반한 최적화 등 로봇 공학의 핵심 알고리즘들이 다변량 가우시안의 성질에 전적으로 의존한다.

8. 참고 문헌

  • Barfoot, T. D. (2017). State Estimation for Robotics. Cambridge University Press.
  • Bishop, C. M. (2006). Pattern Recognition and Machine Learning. Springer.
  • Thrun, S., Burgard, W., & Fox, D. (2005). Probabilistic Robotics. MIT Press.
  • Papoulis, A., & Pillai, S. U. (2002). Probability, Random Variables, and Stochastic Processes (4th ed.). McGraw-Hill.

version: 1.0