30.14 대각화(Diagonalization)의 정의와 대각화 가능 조건

1. 대각화의 정의

$n \times n$ 행렬 $A$ 가 **대각화 가능(diagonalizable)**하다 함은 가역 행렬 $P$ 와 대각 행렬 $D$ 가 존재하여

$A = PDP^{-1}$

이 성립하는 것이다. 동치적으로

$P^{-1}AP = D$

여기서 $D = \text{diag}(\lambda_1, \lambda_2, \ldots, \lambda_n)$ 은 $A$ 의 고유값을 대각 성분으로 갖는 대각 행렬이고, $P = (v_1 \mid v_2 \mid \cdots \mid v_n)$ 은 대응하는 고유벡터를 열로 배치한 행렬이다.

2. 대각화의 구조적 의미

$A = PDP^{-1}$ 에서 등식 $AP = PD$ 의 $j$ 번째 열을 비교하면

$Av_j = \lambda_j v_j, \quad j = 1, 2, \ldots, n$

즉, $P$ 의 각 열 $v_j$ 가 고유값 $\lambda_j$ 에 대응하는 고유벡터이다. $P$ 가 가역이려면 $\{v_1, \ldots, v_n\}$ 이 일차독립이어야 한다.

따라서 $A$ 가 대각화 가능할 필요충분조건은 $A$ 가 $n$ 개의 일차독립 고유벡터를 갖는 것이다.

3. 대각화 가능 조건의 동치 진술

정리. $n \times n$ 행렬 $A$ 에 대하여 다음은 모두 동치이다.

(i) $A$ 는 대각화 가능하다.

(ii) $A$ 는 $n$ 개의 일차독립 고유벡터를 갖는다.

(iii) $\mathbb{F}^n$ 에 $A$ 의 고유벡터로 이루어진 기저(고유 기저)가 존재한다.

(iv) 모든 고유값 $\lambda_i$ 에 대하여 기하학적 중복도와 대수적 중복도가 같다: $d_i = m_i$ .

(v) 전체 공간이 고유 공간의 직합으로 분해된다: $\mathbb{F}^n = \bigoplus_{i=1}^k E_{\lambda_i}$ .

(vi) $A$ 의 최소 다항식(minimal polynomial)이 일차 인수의 곱으로 분해되며 중복 인수가 없다.

4. 충분조건

4.1 $n$ 개의 서로 다른 고유값

따름정리. $A$ 가 $n$ 개의 서로 다른 고유값을 가지면 $A$ 는 대각화 가능하다.

서로 다른 고유값에 대응하는 고유벡터는 일차독립이므로, $n$ 개의 서로 다른 고유값은 $n$ 개의 일차독립 고유벡터를 자동으로 보장한다.

이 조건은 충분조건이지 필요조건이 아니다. $A = I_n$ 은 고유값이 $\lambda = 1$ 하나뿐이지만 대각화 가능하다.

4.2 대칭 행렬

정리 (스펙트럼 정리). 실수 대칭 행렬( $A = A^T$ )은 항상 대각화 가능하다. 더 나아가 직교 행렬에 의한 대각화가 가능하다.

5. 대각화 불가능의 필요조건

$A$ 가 대각화 불가능하려면 적어도 하나의 고유값 $\lambda_i$ 에서 $d_i < m_i$ 이어야 한다. 이 경우 $A$ 를 **결손 행렬(defective matrix)**이라 한다.

5.1 결손 행렬의 예시

$A = \begin{pmatrix} 2 & 1 \\ 0 & 2 \end{pmatrix}$

고유값: $\lambda = 2$ (대수적 중복도 $m = 2$ ). 고유 공간: $E_2 = \text{span}\{e_1\}$ (기하학적 중복도 $d = 1$ ). $d = 1 < m = 2$ 이므로 대각화 불가능하다.

6. 구체적 대각화 절차

$A$ 를 대각화하는 절차는 다음과 같다.

단계 1. 특성 다항식 $p_A(\lambda) = \det(\lambda I - A)$ 를 구한다.

단계 2. $p_A(\lambda) = 0$ 을 풀어 고유값 $\lambda_1, \ldots, \lambda_k$ 와 대수적 중복도 $m_1, \ldots, m_k$ 를 구한다.

단계 3. 각 고유값 $\lambda_i$ 에 대하여 고유 공간 $E_{\lambda_i} = \ker(A - \lambda_i I)$ 의 기저를 구한다.

단계 4. $d_i = m_i$ 를 모든 $i$ 에 대하여 확인한다. 하나라도 $d_i < m_i$ 이면 대각화 불가능이다.

단계 5. 모든 고유 공간의 기저 벡터를 열로 나열하여 $P$ 를 구성하고 $D = \text{diag}(\lambda_1, \ldots, \lambda_n)$ 으로 둔다.

7. 계산 예시

7.1 예시: 대각화 가능한 행렬

$A = \begin{pmatrix} 4 & -2 \\ 1 & 1 \end{pmatrix}$

$p_A(\lambda) = \lambda^2 - 5\lambda + 6 = (\lambda - 2)(\lambda - 3)$ . 고유값: $\lambda_1 = 2$ , $\lambda_2 = 3$ .

$v_1 = \begin{pmatrix} 1 \\ 1 \end{pmatrix}$ , $v_2 = \begin{pmatrix} 2 \\ 1 \end{pmatrix}$ .

$P = \begin{pmatrix} 1 & 2 \\ 1 & 1 \end{pmatrix}, \quad D = \begin{pmatrix} 2 & 0 \\ 0 & 3 \end{pmatrix}$

검증: $P^{-1} = \begin{pmatrix} -1 & 2 \\ 1 & -1 \end{pmatrix}$ 이므로

$PDP^{-1} = \begin{pmatrix} 1 & 2 \\ 1 & 1 \end{pmatrix}\begin{pmatrix} 2 & 0 \\ 0 & 3 \end{pmatrix}\begin{pmatrix} -1 & 2 \\ 1 & -1 \end{pmatrix} = \begin{pmatrix} 4 & -2 \\ 1 & 1 \end{pmatrix} = A \quad \checkmark$

8. 대각화의 유일성

대각 행렬 $D$ 의 대각 성분(고유값)은 유일하지만 순서는 $P$ 의 열 순서에 의존한다. 고유벡터의 스칼라 배를 선택하는 자유도도 존재한다. 따라서 $(P, D)$ 의 쌍은 유일하지 않으나, 고유값의 집합(중복도 포함)은 유일하다.

9. 대각화의 계산적 활용

9.1 행렬의 거듭제곱

$A^k = PD^kP^{-1} = P\begin{pmatrix} \lambda_1^k & & \\ & \ddots & \\ & & \lambda_n^k \end{pmatrix}P^{-1}$

9.2 행렬 지수함수

$e^{At} = Pe^{Dt}P^{-1} = P\begin{pmatrix} e^{\lambda_1 t} & & \\ & \ddots & \\ & & e^{\lambda_n t} \end{pmatrix}P^{-1}$

9.3 행렬 다항식

$f$ 가 다항식이면 $f(A) = Pf(D)P^{-1} = P\text{diag}(f(\lambda_1), \ldots, f(\lambda_n))P^{-1}$ .

이러한 계산적 단순화가 대각화의 실용적 가치의 핵심이다. 대각 행렬의 거듭제곱은 각 대각 성분의 거듭제곱일 뿐이므로, $O(n^3)$ 의 행렬 곱셈을 반복하는 대신 $O(n)$ 의 스칼라 거듭제곱으로 환원된다.