8.11 확률 밀도 함수와 연속 확률 변수

1. 확률 밀도 함수의 정의

연속 확률 변수 $X$ 의 확률 밀도 함수(Probability Density Function, PDF) $f_X(x)$ 는 다음의 조건을 만족하는 비음 함수이다.

$P(a \leq X \leq b) = \int_a^b f_X(x) \, dx$

$f_X(x) \geq 0, \quad \int_{-\infty}^{\infty} f_X(x) \, dx = 1$

$f_X(x)$ 자체는 확률이 아니라 확률 밀도이며, $f_X(x)dx$ 는 미소 구간 $[x, x+dx]$ 에서의 확률 $P(x \leq X \leq x + dx)$ 에 해당한다. $f_X(x) > 1$ 인 값도 가능하다.

CDF와의 관계: $f_X(x) = \frac{d}{dx}F_X(x)$ 이고 $F_X(x) = \int_{-\infty}^{x}f_X(t) \, dt$ 이다.

2. 주요 연속 확률 분포

2.1 균일 분포(Uniform Distribution)

$f_X(x) = \begin{cases} \frac{1}{b-a} & a \leq x \leq b \\ 0 & \text{그 외} \end{cases}$

$\mathbb{E}[X] = (a+b)/2$ , $\text{Var}(X) = (b-a)^2/12$ .

응용: 비정보적 사전 분포, 균일 무작위 샘플링, 초기 상태의 무지(ignorance) 표현.

2.2 정규 분포(Normal/Gaussian Distribution)

$f_X(x) = \frac{1}{\sqrt{2\pi}\sigma}\exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)$

$\mathbb{E}[X] = \mu$ , $\text{Var}(X) = \sigma^2$ . $X \sim \mathcal{N}(\mu, \sigma^2)$ 로 표기한다.

응용: 센서 잡음, 프로세스 잡음, 칼만 필터의 기본 분포. 중심극한정리에 의해 다수의 독립 잡음원의 합이 근사적으로 정규 분포를 따른다.

2.3 지수 분포(Exponential Distribution)

$f_X(x) = \lambda e^{-\lambda x}, \quad x \geq 0$

$\mathbb{E}[X] = 1/\lambda$ , $\text{Var}(X) = 1/\lambda^2$ . 무기억 성질(memoryless property)을 갖는다.

응용: 고장 간 시간, 이벤트 도착 간격, 포아송 과정에서의 대기 시간.

2.4 감마 분포(Gamma Distribution)

$f_X(x) = \frac{\lambda^k}{\Gamma(k)}x^{k-1}e^{-\lambda x}, \quad x \geq 0$

형상 매개변수 $k > 0$ , 비율 매개변수 $\lambda > 0$ . $k = 1$ 이면 지수 분포로 환원된다.

응용: 분산의 사전 분포(베이즈 추론에서), 대기 시간의 합.

2.5 베타 분포(Beta Distribution)

$f_X(x) = \frac{x^{\alpha-1}(1-x)^{\beta-1}}{B(\alpha, \beta)}, \quad 0 \leq x \leq 1$

$B(\alpha, \beta) = \Gamma(\alpha)\Gamma(\beta)/\Gamma(\alpha+\beta)$ . 구간 $[0, 1]$ 에서 정의되는 유연한 분포이다.

응용: 확률 자체의 불확실성 모델링(베르누이 가능도의 켤레 사전).

3. 기대값과 분산

3.1 기대값

$\mathbb{E}[X] = \int_{-\infty}^{\infty} x f_X(x) \, dx$

함수 $g(X)$ 의 기대값:

$\mathbb{E}[g(X)] = \int_{-\infty}^{\infty} g(x) f_X(x) \, dx$

3.2 분산

$\text{Var}(X) = \mathbb{E}[(X - \mu)^2] = \int_{-\infty}^{\infty}(x - \mu)^2 f_X(x) \, dx$

표준 편차: $\sigma = \sqrt{\text{Var}(X)}$ .

4. 확률 밀도의 변수 변환

$Y = g(X)$ 이고 $g$ 가 단조 함수일 때, $Y$ 의 PDF는 다음과 같다.

$f_Y(y) = f_X(g^{-1}(y))\left\lvert\frac{dg^{-1}}{dy}\right\rvert$

다변수의 경우 야코비안의 절대값이 스케일링 인자이다.

$f_{\mathbf{Y}}(\mathbf{y}) = f_{\mathbf{X}}(\mathbf{g}^{-1}(\mathbf{y}))\left\lvert\det\frac{\partial \mathbf{g}^{-1}}{\partial \mathbf{y}}\right\rvert$

로봇 기구학에서 관절 공간 확률 분포를 작업 공간으로 변환할 때 이 공식이 적용된다.

5. 로봇 공학에서의 연속 확률 변수

로봇 공학에서 다루는 대부분의 물리량(위치, 속도, 힘, 토크 등)이 연속 확률 변수로 모델링된다. 센서의 잡음 특성이 PDF로 기술되며, 상태 추정기(칼만 필터 등)가 상태의 PDF를 유지하고 갱신한다.

가우시안 분포가 가장 널리 사용되는 이유는 다음과 같다.

중심극한정리에 의한 이론적 정당화
기대값과 공분산만으로 완전히 특성화(최소 파라미터)
가우시안의 선형 변환이 여전히 가우시안
베이즈 갱신에서 켤레 관계의 유지(칼만 필터)

6. 참고 문헌

Papoulis, A., & Pillai, S. U. (2002). Probability, Random Variables, and Stochastic Processes (4th ed.). McGraw-Hill.
Ross, S. M. (2014). A First Course in Probability (9th ed.). Pearson.
Thrun, S., Burgard, W., & Fox, D. (2005). Probabilistic Robotics. MIT Press.
Kay, S. M. (1993). Fundamentals of Statistical Signal Processing: Estimation Theory. Prentice Hall.

version: 1.0