29.17 대각화(Diagonalization)의 정의와 대각화 가능 조건

29.17 대각화(Diagonalization)의 정의와 대각화 가능 조건

1. 대각화의 정의

n \times n 행렬 A가 **대각화 가능(diagonalizable)**하다 함은 다음을 만족하는 가역 행렬 P와 대각 행렬 D가 존재하는 것이다.

A = PDP^{-1}

동치적으로

D = P^{-1}AP

이다. 여기서 D = \text{diag}(\lambda_1, \lambda_2, \ldots, \lambda_n)은 대각 성분이 A의 고유값인 대각 행렬이고, P의 열벡터들은 대응하는 고유벡터이다.

선형 변환의 관점에서, T : V \to V가 대각화 가능하다 함은 V의 어떤 기저에 대하여 T의 행렬 표현이 대각 행렬이 되는 것이다. 이러한 기저는 T의 고유벡터들로 구성된다.

2. 대각화의 구조적 의미

A = PDP^{-1}에서 P = (v_1 \mid v_2 \mid \cdots \mid v_n)이라 하면, 등식 AP = PDj번째 열은

Av_j = \lambda_j v_j, \quad j = 1, 2, \ldots, n

을 나타낸다. 즉, P의 각 열 v_j는 고유값 \lambda_j에 대응하는 A의 고유벡터이다. P가 가역이려면 \{v_1, v_2, \ldots, v_n\}\mathbb{R}^n(또는 \mathbb{C}^n)의 기저를 이루어야 한다.

따라서 A가 대각화 가능할 필요충분조건은 An개의 일차독립인 고유벡터를 갖는 것이다.

3. 대각화 가능의 필요충분조건

3.1 정리 (대각화 가능 판별)

n \times n 행렬 A에 대하여 다음은 동치이다.

(i) A는 대각화 가능하다.

(ii) An개의 일차독립인 고유벡터를 갖는다.

(iii) 고유벡터들로 이루어진 기저(고유 기저, eigenbasis)가 \mathbb{R}^n(또는 \mathbb{C}^n)에 존재한다.

(iv) 모든 고유값 \lambda_i에 대하여, 기하적 중복도가 대수적 중복도와 같다.

\dim(\ker(A - \lambda_i I)) = m_i

여기서 m_i는 특성 다항식 \det(\lambda I - A)에서 (\lambda - \lambda_i)의 거듭제곱 지수, 즉 대수적 중복도이다.

(v) A의 서로 다른 고유값이 \lambda_1, \lambda_2, \ldots, \lambda_k이고 각각의 기하적 중복도가 d_1, d_2, \ldots, d_k일 때

\sum_{i=1}^{k} d_i = n

3.2 증명의 핵심 단계

(i) \Leftrightarrow (ii): 위에서 이미 확인하였다. A = PDP^{-1}이 성립하려면 P가 가역이어야 하고, 이는 Pn개 열(고유벡터)이 일차독립임과 동치이다.

(ii) \Leftrightarrow (iv): 핵심 부등식은 각 고유값 \lambda_i에 대하여

1 \leq \dim(\ker(A - \lambda_i I)) \leq m_i

가 항상 성립한다는 것이다. 좌측 부등식은 고유값의 정의로부터, 우측 부등식은 특성 다항식의 인수 분해로부터 도출된다.

서로 다른 고유값에 대응하는 고유 공간들의 직합(direct sum)의 차원은

\dim\left(\bigoplus_{i=1}^{k} \ker(A - \lambda_i I)\right) = \sum_{i=1}^{k} \dim(\ker(A - \lambda_i I))

이며, \sum_{i=1}^{k} m_i = n이므로 \sum_{i=1}^{k} d_i = n이 성립할 필요충분조건은 모든 i에 대하여 d_i = m_i인 것이다. \blacksquare

4. 대각화 가능의 충분조건

4.1 서로 다른 n개의 고유값

정리. An개의 서로 다른 고유값을 가지면 A는 대각화 가능하다.

증명. 서로 다른 고유값에 대응하는 고유벡터들은 일차독립이다. 이를 귀납법으로 보인다.

\lambda_1, \lambda_2, \ldots, \lambda_n이 서로 다른 고유값이고, v_1, v_2, \ldots, v_n이 대응하는 고유벡터라 하자.

c_1 v_1 + c_2 v_2 + \cdots + c_n v_n = 0 \quad \cdots (*)

이라 가정하자. (*)의 양변에 A를 적용하면

c_1 \lambda_1 v_1 + c_2 \lambda_2 v_2 + \cdots + c_n \lambda_n v_n = 0 \quad \cdots (**)

(**) - \lambda_n \cdot (*)을 계산하면

c_1 (\lambda_1 - \lambda_n) v_1 + c_2 (\lambda_2 - \lambda_n) v_2 + \cdots + c_{n-1}(\lambda_{n-1} - \lambda_n) v_{n-1} = 0

귀납 가정에 의해 v_1, \ldots, v_{n-1}은 일차독립이고, \lambda_i - \lambda_n \neq 0 (i < n)이므로 c_1 = c_2 = \cdots = c_{n-1} = 0이다. (*)에 대입하면 c_n v_n = 0이고 v_n \neq 0이므로 c_n = 0이다. \blacksquare

이 조건은 충분조건이지 필요조건이 아니다. 예를 들어, 항등 행렬 I_n은 고유값이 \lambda = 1 하나뿐이지만 대각화 가능하다(이미 대각 행렬이다).

4.2 실대칭 행렬의 대각화

정리 (스펙트럼 정리, spectral theorem). 실대칭 행렬(A = A^T)은 항상 대각화 가능하다. 더 나아가, 직교 행렬 Q에 의하여

A = Q D Q^T

로 직교 대각화(orthogonal diagonalization)할 수 있다.

이 정리는 대칭 행렬의 고유값이 모두 실수이고, 서로 다른 고유값에 대응하는 고유 공간이 직교한다는 성질로부터 도출된다.

5. 대각화 불가능의 예시

5.1 예시 1: 결손 행렬(Defective Matrix)

A = \begin{pmatrix} 2 & 1 \\ 0 & 2 \end{pmatrix}

특성 다항식은 (\lambda - 2)^2 = 0이므로 고유값 \lambda = 2 (대수적 중복도 2). 고유 공간은

\ker(A - 2I) = \ker\begin{pmatrix} 0 & 1 \\ 0 & 0 \end{pmatrix} = \text{span}\left\{\begin{pmatrix} 1 \\ 0 \end{pmatrix}\right\}

기하적 중복도가 1 < 2(대수적 중복도)이므로 A는 대각화 불가능하다. 이러한 행렬을 **결손 행렬(defective matrix)**이라 한다.

5.2 예시 2: 회전 행렬

\theta \neq 0, \pi2 \times 2 회전 행렬

R_\theta = \begin{pmatrix} \cos\theta & -\sin\theta \\ \sin\theta & \cos\theta \end{pmatrix}

의 특성 다항식은 \lambda^2 - 2\cos\theta \cdot \lambda + 1 = 0이며, \theta \neq 0, \pi일 때 판별식 4\cos^2\theta - 4 < 0이므로 실수 고유값이 존재하지 않는다. 따라서 \mathbb{R} 위에서는 대각화 불가능하다. 그러나 \mathbb{C} 위에서는 고유값 e^{\pm i\theta}에 대응하는 복소 고유벡터가 존재하므로 대각화 가능하다.

6. 대각화 절차

n \times n 행렬 A를 대각화하는 구체적 절차는 다음과 같다.

단계 1. 특성 다항식 \det(\lambda I - A) = 0을 풀어 고유값 \lambda_1, \lambda_2, \ldots, \lambda_k와 각각의 대수적 중복도 m_1, m_2, \ldots, m_k를 구한다.

단계 2. 각 고유값 \lambda_i에 대하여 고유 공간 \ker(A - \lambda_i I)의 기저를 구한다. 기하적 중복도 d_i = \dim(\ker(A - \lambda_i I))를 확인한다.

단계 3. 모든 i에 대하여 d_i = m_i인지 검증한다. 하나라도 d_i < m_i이면 대각화 불가능이다.

단계 4. d_i = m_i가 모든 i에 대하여 성립하면, 각 고유 공간의 기저 벡터들을 모아 행렬 P = (v_1 \mid v_2 \mid \cdots \mid v_n)을 구성한다.

단계 5. D = \text{diag}(\lambda_1, \ldots, \lambda_1, \lambda_2, \ldots, \lambda_2, \ldots, \lambda_k, \ldots, \lambda_k)로 둔다. 각 \lambda_im_i번 반복된다.

7. 구체적 계산 예시

행렬 A = \begin{pmatrix} 4 & -2 \\ 1 & 1 \end{pmatrix}을 대각화하라.

단계 1. 특성 다항식:

\det(\lambda I - A) = (\lambda - 4)(\lambda - 1) + 2 = \lambda^2 - 5\lambda + 6 = (\lambda - 2)(\lambda - 3)

고유값: \lambda_1 = 2, \lambda_2 = 3 (각각 대수적 중복도 1).

단계 2. \lambda_1 = 2:

A - 2I = \begin{pmatrix} 2 & -2 \\ 1 & -1 \end{pmatrix} \implies v_1 = \begin{pmatrix} 1 \\ 1 \end{pmatrix}

\lambda_2 = 3:

A - 3I = \begin{pmatrix} 1 & -2 \\ 1 & -2 \end{pmatrix} \implies v_2 = \begin{pmatrix} 2 \\ 1 \end{pmatrix}

단계 3. 서로 다른 고유값 2개이므로 대각화 가능하다.

단계 4-5.

P = \begin{pmatrix} 1 & 2 \\ 1 & 1 \end{pmatrix}, \quad D = \begin{pmatrix} 2 & 0 \\ 0 & 3 \end{pmatrix}

검증: P^{-1} = \begin{pmatrix} -1 & 2 \\ 1 & -1 \end{pmatrix}이므로

P^{-1}AP = \begin{pmatrix} -1 & 2 \\ 1 & -1 \end{pmatrix}\begin{pmatrix} 4 & -2 \\ 1 & 1 \end{pmatrix}\begin{pmatrix} 1 & 2 \\ 1 & 1 \end{pmatrix} = \begin{pmatrix} 2 & 0 \\ 0 & 3 \end{pmatrix} = D \quad \checkmark

8. 대각화의 계산적 활용

대각화의 가장 직접적인 응용은 행렬의 거듭제곱 계산이다. A = PDP^{-1}이면

A^k = PD^kP^{-1} = P \begin{pmatrix} \lambda_1^k & & \\ & \ddots & \\ & & \lambda_n^k \end{pmatrix} P^{-1}

이 결과는 대각 행렬의 거듭제곱이 각 대각 성분의 거듭제곱으로 환원된다는 사실에 기반한다. 행렬 지수함수(matrix exponential) e^{At}의 계산에도 동일한 원리가 적용된다.

e^{At} = P \begin{pmatrix} e^{\lambda_1 t} & & \\ & \ddots & \\ & & e^{\lambda_n t} \end{pmatrix} P^{-1}

이러한 계산적 단순화는 대각화가 선형대수학과 그 응용에서 갖는 실용적 가치의 핵심이다.