8.20 다변량 가우시안 분포의 기하학적 해석

1. 등확률 밀도 타원체

다변량 가우시안 $\mathbf{X} \sim \mathcal{N}(\boldsymbol{\mu}, \boldsymbol{\Sigma})$ 의 등확률 밀도(iso-density) 곡면은 마할라노비스 거리가 일정한 점들의 집합으로, 타원체를 형성한다.

$(\mathbf{x} - \boldsymbol{\mu})^T\boldsymbol{\Sigma}^{-1}(\mathbf{x} - \boldsymbol{\mu}) = c^2$

상수 $c$ 의 값에 따라 동심의 타원체 계열이 형성되며, $c$ 가 클수록 외곽의 타원체이다. 2차원에서는 타원, 3차원에서는 타원체이다.

2. 공분산 행렬의 고유값 분해와 기하학적 해석

공분산 행렬의 고유값 분해 $\boldsymbol{\Sigma} = \mathbf{V}\boldsymbol{\Lambda}\mathbf{V}^T$ 에서:

고유벡터 $\mathbf{v}_1, \ldots, \mathbf{v}_n$ : 타원체의 주축(principal axis) 방향
고유값 $\lambda_1, \ldots, \lambda_n$ : 각 주축 방향의 분산

타원체의 $i$ 번째 반축 길이는 $c\sqrt{\lambda_i}$ 이다. 고유값이 큰 방향은 불확실성이 크고, 작은 방향은 불확실성이 작다.

2.1 주성분 해석과의 관계

공분산 행렬의 고유값 분해는 주성분 분석(Principal Component Analysis, PCA)과 동일한 구조이다. 최대 고유값에 대응하는 고유벡터가 분포의 최대 분산 방향(제1 주성분)이다.

3. 확률 타원체(Confidence Ellipsoid)

3.1 $\sigma$ -타원체

$c = k$ 인 등밀도 타원체는 “ $k\sigma$ 타원체“라 불리며, 해당 타원체 내에 포함될 확률은 마할라노비스 거리의 제곱 $d^2 = c^2$ 가 카이제곱 분포 $\chi^2_n$ 을 따르는 것에 의해 결정된다.

$P\left((\mathbf{X} - \boldsymbol{\mu})^T\boldsymbol{\Sigma}^{-1}(\mathbf{X} - \boldsymbol{\mu}) \leq \chi^2_{n,\alpha}\right) = 1 - \alpha$

3.2 차원별 포함 확률

차원 $n$	1 $\sigma$ ( $c = 1$ )	2 $\sigma$ ( $c = 2$ )	3 $\sigma$ ( $c = 3$ )
1	68.3%	95.4%	99.7%
2	39.3%	86.5%	98.9%
3	19.9%	73.9%	97.1%

차원이 증가할수록 동일한 $c$ 에 대한 포함 확률이 감소한다. 이는 고차원 가우시안에서 확률 질량이 평균으로부터 떨어진 “껍질“에 집중되기 때문이다.

4. 불확실성의 시각화

4.1 차원 신뢰 타원

로봇의 2차원 위치 불확실성을 시각화하는 가장 일반적인 방법이 신뢰 타원(confidence ellipse)이다. 공분산 행렬 $\boldsymbol{\Sigma}_{2 \times 2}$ 의 고유값 분해로부터 타원의 장축 방향, 장축/단축 반경을 결정한다.

95% 신뢰 타원( $\chi^2_2$ 분위수 $\approx 5.991$ ):

$\text{반축 길이} = \sqrt{5.991 \cdot \lambda_i}, \quad i = 1, 2$

4.2 차원 불확실성 타원체

로봇의 3차원 위치 불확실성은 신뢰 타원체로 시각화된다. $\chi^2_3$ 의 95% 분위수는 약 7.815이다.

5. 공분산의 조건과 기하학적 의미

구형 분포(spherical): $\boldsymbol{\Sigma} = \sigma^2\mathbf{I}$ . 모든 방향에서 분산이 동일. 등밀도 곡면이 구이다.

대각 공분산: $\boldsymbol{\Sigma} = \text{diag}(\sigma_1^2, \ldots, \sigma_n^2)$ . 주축이 좌표축에 정렬된 타원체. 변수 간 상관 없음.

일반 공분산: 주축이 좌표축에서 회전된 타원체. 변수 간 상관 존재.

특이 공분산: $\lvert\boldsymbol{\Sigma}\rvert = 0$ . 분포가 부분 공간에 집중되어 퇴화(degenerate)된다. 영이 아닌 고유값에 대응하는 고유벡터가 이루는 부분 공간에 확률이 집중된다.

6. 마할라노비스 거리의 응용

마할라노비스 거리 $d_M = \sqrt{(\mathbf{x} - \boldsymbol{\mu})^T\boldsymbol{\Sigma}^{-1}(\mathbf{x} - \boldsymbol{\mu})}$ 는 공분산 구조를 고려한 “정규화된 거리“이다.

데이터 연관(Data Association): SLAM에서 관측과 기존 랜드마크의 대응을 결정할 때, 마할라노비스 거리가 유클리드 거리 대신 사용된다. 문 임계값(gate threshold) $d_M \leq \chi_{n,\alpha}$ 로 대응 후보를 선별한다.

이상치 제거: $d_M$ 이 큰 관측을 이상치로 판정하여 상태 추정에서 제외한다.

7. 참고 문헌

Barfoot, T. D. (2017). State Estimation for Robotics. Cambridge University Press.
Bishop, C. M. (2006). Pattern Recognition and Machine Learning. Springer.
Thrun, S., Burgard, W., & Fox, D. (2005). Probabilistic Robotics. MIT Press.
Bar-Shalom, Y., Li, X. R., & Kirubarajan, T. (2001). Estimation with Applications to Tracking and Navigation. Wiley.

version: 1.0