LDLT 분해는 대칭 행렬(또는 에르미트 행렬)을 LD로 분해하는 방식을 의미한다. 여기서 L은 하삼각 행렬, D는 대각 행렬이다. 이는 대칭 행렬 A를 다음과 같이 나타내는 방법이다:

\mathbf{A} = \mathbf{L} \mathbf{D} \mathbf{L}^T

Sholesky 분해와 비교하면, Sholesky 분해에서 A는 다음과 같이 분해된다:

\mathbf{A} = \mathbf{L} \mathbf{L}^T

여기서 L은 하삼각 행렬이다.

Sholesky 분해와 LDLT 분해의 차이

행렬의 형태

대각 행렬의 포함 여부

계산의 차이점

LDLT 분해는 복잡도 면에서 Sholesky 분해와 비슷하지만 약간 더 복잡한다. 이 때문에 대각 요소의 계산이 조금 더 필요하다. 예를 들어, 아래와 같이 ALD로 분해한다:

활용의 차이

계산 예

Sholesky 분해에서는:

\mathbf{A} = \begin{bmatrix} 4 & 12 & -16 \\ 12 & 37 & -43 \\ -16 & -43 & 98 \end{bmatrix} = \mathbf{L} \mathbf{L}^T = \begin{bmatrix} 2 & 0 & 0 \\ 6 & 1 & 0 \\ -8 & 5 & 3 \end{bmatrix} \begin{bmatrix} 2 & 6 & -8 \\ 0 & 1 & 5 \\ 0 & 0 & 3 \end{bmatrix}

반면, LDLT 분해에서는:

\mathbf{A} = \begin{bmatrix} 4 & 12 & -16 \\ 12 & 37 & -43 \\ -16 & -43 & 98 \end{bmatrix} = \mathbf{L} \mathbf{D} \mathbf{L}^T = \begin{bmatrix} 1 & 0 & 0 \\ 3 & 1 & 0 \\ -4 & 5 & 1 \end{bmatrix} \begin{bmatrix} 4 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 9 \end{bmatrix} \begin{bmatrix} 1 & 3 & -4 \\ 0 & 1 & 5 \\ 0 & 0 & 1 \end{bmatrix}

Sholesky 분해의 한계

행렬 조건

수치적 안정성

처리 불가능한 행렬

Sholesky 분해의 응용

선형 시스템 해법

Sholesky 분해는 선형 시스템 \mathbf{A} \mathbf{x} = \mathbf{b}를 푸는 데 자주 사용된다. 여기서 \mathbf{A}는 대칭 양의 정부호 행렬이다. Sholesky 분해를 통해 \mathbf{A} = \mathbf{L} \mathbf{L}^T로 분해한 다음, 두 단계로 나누어 문제를 푼다:

  1. \mathbf{L} \mathbf{y} = \mathbf{b}를 풀어 \mathbf{y}를 구한다.
  2. \mathbf{L}^T \mathbf{x} = \mathbf{y}를 풀어 \mathbf{x}를 구한다.

이 방법은 매우 효율적이고, 특히 행렬 \mathbf{A}가 큰 경우에 유리한다.

최소 자승법 (Least Squares)

회귀 분석에서, 최소 자승법을 사용하여 계수를 구할 때 Sholesky 분해를 사용할 수 있다. 예를 들어, 행렬 방정식 \mathbf{A} = \mathbf{X}^T \mathbf{X}\mathbf{b} = \mathbf{X}^T \mathbf{y}가 주어졌을 때, Sholesky 분해를 사용하여 효율적으로 풀 수 있다.

공분산 행렬 계산

통계학 및 데이터 과학에서 대칭 양의 정부호 공분산 행렬의 분해에 주로 사용된다. 이를 통해 다변량 정규 분포 등을 모델링할 수 있다.

최적화 문제

최적화 문제에서 제한 조건이 있는 경우, Hessian 행렬이 양의 정부호인 경우가 많다. 이 때 Sholesky 분해를 사용하여 해당 행렬을 분해함으로써 최적화 문제를 효율적으로 풀 수 있다.

시뮬레이션 및 샘플링

다변량 정규 분포에서 랜덤 샘플을 생성하기 위한 방법으로 Sholesky 분해를 사용한다. 이는 공분산 구조를 유지하면서 샘플링 과정을 단순화할 수 있게 도와준다.