30.14 대각화(Diagonalization)의 정의와 대각화 가능 조건

30.14 대각화(Diagonalization)의 정의와 대각화 가능 조건

1. 대각화의 정의

n \times n 행렬 A가 **대각화 가능(diagonalizable)**하다 함은 가역 행렬 P와 대각 행렬 D가 존재하여

A = PDP^{-1}

이 성립하는 것이다. 동치적으로

P^{-1}AP = D

여기서 D = \text{diag}(\lambda_1, \lambda_2, \ldots, \lambda_n)A의 고유값을 대각 성분으로 갖는 대각 행렬이고, P = (v_1 \mid v_2 \mid \cdots \mid v_n)은 대응하는 고유벡터를 열로 배치한 행렬이다.

2. 대각화의 구조적 의미

A = PDP^{-1}에서 등식 AP = PDj번째 열을 비교하면

Av_j = \lambda_j v_j, \quad j = 1, 2, \ldots, n

즉, P의 각 열 v_j가 고유값 \lambda_j에 대응하는 고유벡터이다. P가 가역이려면 \{v_1, \ldots, v_n\}이 일차독립이어야 한다.

따라서 A가 대각화 가능할 필요충분조건은 An개의 일차독립 고유벡터를 갖는 것이다.

3. 대각화 가능 조건의 동치 진술

정리. n \times n 행렬 A에 대하여 다음은 모두 동치이다.

(i) A는 대각화 가능하다.

(ii) An개의 일차독립 고유벡터를 갖는다.

(iii) \mathbb{F}^nA의 고유벡터로 이루어진 기저(고유 기저)가 존재한다.

(iv) 모든 고유값 \lambda_i에 대하여 기하학적 중복도와 대수적 중복도가 같다: d_i = m_i.

(v) 전체 공간이 고유 공간의 직합으로 분해된다: \mathbb{F}^n = \bigoplus_{i=1}^k E_{\lambda_i}.

(vi) A의 최소 다항식(minimal polynomial)이 일차 인수의 곱으로 분해되며 중복 인수가 없다.

4. 충분조건

4.1 n개의 서로 다른 고유값

따름정리. An개의 서로 다른 고유값을 가지면 A는 대각화 가능하다.

서로 다른 고유값에 대응하는 고유벡터는 일차독립이므로, n개의 서로 다른 고유값은 n개의 일차독립 고유벡터를 자동으로 보장한다.

이 조건은 충분조건이지 필요조건이 아니다. A = I_n은 고유값이 \lambda = 1 하나뿐이지만 대각화 가능하다.

4.2 대칭 행렬

정리 (스펙트럼 정리). 실수 대칭 행렬(A = A^T)은 항상 대각화 가능하다. 더 나아가 직교 행렬에 의한 대각화가 가능하다.

5. 대각화 불가능의 필요조건

A가 대각화 불가능하려면 적어도 하나의 고유값 \lambda_i에서 d_i < m_i이어야 한다. 이 경우 A를 **결손 행렬(defective matrix)**이라 한다.

5.1 결손 행렬의 예시

A = \begin{pmatrix} 2 & 1 \\ 0 & 2 \end{pmatrix}

고유값: \lambda = 2 (대수적 중복도 m = 2). 고유 공간: E_2 = \text{span}\{e_1\} (기하학적 중복도 d = 1). d = 1 < m = 2이므로 대각화 불가능하다.

6. 구체적 대각화 절차

A를 대각화하는 절차는 다음과 같다.

단계 1. 특성 다항식 p_A(\lambda) = \det(\lambda I - A)를 구한다.

단계 2. p_A(\lambda) = 0을 풀어 고유값 \lambda_1, \ldots, \lambda_k와 대수적 중복도 m_1, \ldots, m_k를 구한다.

단계 3. 각 고유값 \lambda_i에 대하여 고유 공간 E_{\lambda_i} = \ker(A - \lambda_i I)의 기저를 구한다.

단계 4. d_i = m_i를 모든 i에 대하여 확인한다. 하나라도 d_i < m_i이면 대각화 불가능이다.

단계 5. 모든 고유 공간의 기저 벡터를 열로 나열하여 P를 구성하고 D = \text{diag}(\lambda_1, \ldots, \lambda_n)으로 둔다.

7. 계산 예시

7.1 예시: 대각화 가능한 행렬

A = \begin{pmatrix} 4 & -2 \\ 1 & 1 \end{pmatrix}

p_A(\lambda) = \lambda^2 - 5\lambda + 6 = (\lambda - 2)(\lambda - 3). 고유값: \lambda_1 = 2, \lambda_2 = 3.

v_1 = \begin{pmatrix} 1 \\ 1 \end{pmatrix}, v_2 = \begin{pmatrix} 2 \\ 1 \end{pmatrix}.

P = \begin{pmatrix} 1 & 2 \\ 1 & 1 \end{pmatrix}, \quad D = \begin{pmatrix} 2 & 0 \\ 0 & 3 \end{pmatrix}

검증: P^{-1} = \begin{pmatrix} -1 & 2 \\ 1 & -1 \end{pmatrix}이므로

PDP^{-1} = \begin{pmatrix} 1 & 2 \\ 1 & 1 \end{pmatrix}\begin{pmatrix} 2 & 0 \\ 0 & 3 \end{pmatrix}\begin{pmatrix} -1 & 2 \\ 1 & -1 \end{pmatrix} = \begin{pmatrix} 4 & -2 \\ 1 & 1 \end{pmatrix} = A \quad \checkmark

8. 대각화의 유일성

대각 행렬 D의 대각 성분(고유값)은 유일하지만 순서는 P의 열 순서에 의존한다. 고유벡터의 스칼라 배를 선택하는 자유도도 존재한다. 따라서 (P, D)의 쌍은 유일하지 않으나, 고유값의 집합(중복도 포함)은 유일하다.

9. 대각화의 계산적 활용

9.1 행렬의 거듭제곱

A^k = PD^kP^{-1} = P\begin{pmatrix} \lambda_1^k & & \\ & \ddots & \\ & & \lambda_n^k \end{pmatrix}P^{-1}

9.2 행렬 지수함수

e^{At} = Pe^{Dt}P^{-1} = P\begin{pmatrix} e^{\lambda_1 t} & & \\ & \ddots & \\ & & e^{\lambda_n t} \end{pmatrix}P^{-1}

9.3 행렬 다항식

f가 다항식이면 f(A) = Pf(D)P^{-1} = P\text{diag}(f(\lambda_1), \ldots, f(\lambda_n))P^{-1}.

이러한 계산적 단순화가 대각화의 실용적 가치의 핵심이다. 대각 행렬의 거듭제곱은 각 대각 성분의 거듭제곱일 뿐이므로, O(n^3)의 행렬 곱셈을 반복하는 대신 O(n)의 스칼라 거듭제곱으로 환원된다.