29.17 대각화(Diagonalization)의 정의와 대각화 가능 조건

1. 대각화의 정의

$n \times n$ 행렬 $A$ 가 **대각화 가능(diagonalizable)**하다 함은 다음을 만족하는 가역 행렬 $P$ 와 대각 행렬 $D$ 가 존재하는 것이다.

$A = PDP^{-1}$

동치적으로

$D = P^{-1}AP$

이다. 여기서 $D = \text{diag}(\lambda_1, \lambda_2, \ldots, \lambda_n)$ 은 대각 성분이 $A$ 의 고유값인 대각 행렬이고, $P$ 의 열벡터들은 대응하는 고유벡터이다.

선형 변환의 관점에서, $T : V \to V$ 가 대각화 가능하다 함은 $V$ 의 어떤 기저에 대하여 $T$ 의 행렬 표현이 대각 행렬이 되는 것이다. 이러한 기저는 $T$ 의 고유벡터들로 구성된다.

2. 대각화의 구조적 의미

$A = PDP^{-1}$ 에서 $P = (v_1 \mid v_2 \mid \cdots \mid v_n)$ 이라 하면, 등식 $AP = PD$ 의 $j$ 번째 열은

$Av_j = \lambda_j v_j, \quad j = 1, 2, \ldots, n$

을 나타낸다. 즉, $P$ 의 각 열 $v_j$ 는 고유값 $\lambda_j$ 에 대응하는 $A$ 의 고유벡터이다. $P$ 가 가역이려면 $\{v_1, v_2, \ldots, v_n\}$ 이 $\mathbb{R}^n$ (또는 $\mathbb{C}^n$ )의 기저를 이루어야 한다.

따라서 $A$ 가 대각화 가능할 필요충분조건은 $A$ 가 $n$ 개의 일차독립인 고유벡터를 갖는 것이다.

3. 대각화 가능의 필요충분조건

3.1 정리 (대각화 가능 판별)

$n \times n$ 행렬 $A$ 에 대하여 다음은 동치이다.

(i) $A$ 는 대각화 가능하다.

(ii) $A$ 는 $n$ 개의 일차독립인 고유벡터를 갖는다.

(iii) 고유벡터들로 이루어진 기저(고유 기저, eigenbasis)가 $\mathbb{R}^n$ (또는 $\mathbb{C}^n$ )에 존재한다.

(iv) 모든 고유값 $\lambda_i$ 에 대하여, 기하적 중복도가 대수적 중복도와 같다.

$\dim(\ker(A - \lambda_i I)) = m_i$

여기서 $m_i$ 는 특성 다항식 $\det(\lambda I - A)$ 에서 $(\lambda - \lambda_i)$ 의 거듭제곱 지수, 즉 대수적 중복도이다.

(v) $A$ 의 서로 다른 고유값이 $\lambda_1, \lambda_2, \ldots, \lambda_k$ 이고 각각의 기하적 중복도가 $d_1, d_2, \ldots, d_k$ 일 때

$\sum_{i=1}^{k} d_i = n$

3.2 증명의 핵심 단계

(i) $\Leftrightarrow$ (ii): 위에서 이미 확인하였다. $A = PDP^{-1}$ 이 성립하려면 $P$ 가 가역이어야 하고, 이는 $P$ 의 $n$ 개 열(고유벡터)이 일차독립임과 동치이다.

(ii) $\Leftrightarrow$ (iv): 핵심 부등식은 각 고유값 $\lambda_i$ 에 대하여

$1 \leq \dim(\ker(A - \lambda_i I)) \leq m_i$

가 항상 성립한다는 것이다. 좌측 부등식은 고유값의 정의로부터, 우측 부등식은 특성 다항식의 인수 분해로부터 도출된다.

서로 다른 고유값에 대응하는 고유 공간들의 직합(direct sum)의 차원은

$\dim\left(\bigoplus_{i=1}^{k} \ker(A - \lambda_i I)\right) = \sum_{i=1}^{k} \dim(\ker(A - \lambda_i I))$

이며, $\sum_{i=1}^{k} m_i = n$ 이므로 $\sum_{i=1}^{k} d_i = n$ 이 성립할 필요충분조건은 모든 $i$ 에 대하여 $d_i = m_i$ 인 것이다. $\blacksquare$

4. 대각화 가능의 충분조건

4.1 서로 다른 $n$ 개의 고유값

정리. $A$ 가 $n$ 개의 서로 다른 고유값을 가지면 $A$ 는 대각화 가능하다.

증명. 서로 다른 고유값에 대응하는 고유벡터들은 일차독립이다. 이를 귀납법으로 보인다.

$\lambda_1, \lambda_2, \ldots, \lambda_n$ 이 서로 다른 고유값이고, $v_1, v_2, \ldots, v_n$ 이 대응하는 고유벡터라 하자.

$c_1 v_1 + c_2 v_2 + \cdots + c_n v_n = 0 \quad \cdots (*)$

이라 가정하자. $(*)$ 의 양변에 $A$ 를 적용하면

$c_1 \lambda_1 v_1 + c_2 \lambda_2 v_2 + \cdots + c_n \lambda_n v_n = 0 \quad \cdots (**)$

$(**) - \lambda_n \cdot (*)$ 을 계산하면

$c_1 (\lambda_1 - \lambda_n) v_1 + c_2 (\lambda_2 - \lambda_n) v_2 + \cdots + c_{n-1}(\lambda_{n-1} - \lambda_n) v_{n-1} = 0$

귀납 가정에 의해 $v_1, \ldots, v_{n-1}$ 은 일차독립이고, $\lambda_i - \lambda_n \neq 0$ ( $i < n$ )이므로 $c_1 = c_2 = \cdots = c_{n-1} = 0$ 이다. $(*)$ 에 대입하면 $c_n v_n = 0$ 이고 $v_n \neq 0$ 이므로 $c_n = 0$ 이다. $\blacksquare$

이 조건은 충분조건이지 필요조건이 아니다. 예를 들어, 항등 행렬 $I_n$ 은 고유값이 $\lambda = 1$ 하나뿐이지만 대각화 가능하다(이미 대각 행렬이다).

4.2 실대칭 행렬의 대각화

정리 (스펙트럼 정리, spectral theorem). 실대칭 행렬( $A = A^T$ )은 항상 대각화 가능하다. 더 나아가, 직교 행렬 $Q$ 에 의하여

$A = Q D Q^T$

로 직교 대각화(orthogonal diagonalization)할 수 있다.

이 정리는 대칭 행렬의 고유값이 모두 실수이고, 서로 다른 고유값에 대응하는 고유 공간이 직교한다는 성질로부터 도출된다.

5. 대각화 불가능의 예시

5.1 예시 1: 결손 행렬(Defective Matrix)

$A = \begin{pmatrix} 2 & 1 \\ 0 & 2 \end{pmatrix}$

특성 다항식은 $(\lambda - 2)^2 = 0$ 이므로 고유값 $\lambda = 2$ (대수적 중복도 2). 고유 공간은

$\ker(A - 2I) = \ker\begin{pmatrix} 0 & 1 \\ 0 & 0 \end{pmatrix} = \text{span}\left\{\begin{pmatrix} 1 \\ 0 \end{pmatrix}\right\}$

기하적 중복도가 $1 < 2$ (대수적 중복도)이므로 $A$ 는 대각화 불가능하다. 이러한 행렬을 **결손 행렬(defective matrix)**이라 한다.

5.2 예시 2: 회전 행렬

$\theta \neq 0, \pi$ 인 $2 \times 2$ 회전 행렬

$R_\theta = \begin{pmatrix} \cos\theta & -\sin\theta \\ \sin\theta & \cos\theta \end{pmatrix}$

의 특성 다항식은 $\lambda^2 - 2\cos\theta \cdot \lambda + 1 = 0$ 이며, $\theta \neq 0, \pi$ 일 때 판별식 $4\cos^2\theta - 4 < 0$ 이므로 실수 고유값이 존재하지 않는다. 따라서 $\mathbb{R}$ 위에서는 대각화 불가능하다. 그러나 $\mathbb{C}$ 위에서는 고유값 $e^{\pm i\theta}$ 에 대응하는 복소 고유벡터가 존재하므로 대각화 가능하다.

6. 대각화 절차

$n \times n$ 행렬 $A$ 를 대각화하는 구체적 절차는 다음과 같다.

단계 1. 특성 다항식 $\det(\lambda I - A) = 0$ 을 풀어 고유값 $\lambda_1, \lambda_2, \ldots, \lambda_k$ 와 각각의 대수적 중복도 $m_1, m_2, \ldots, m_k$ 를 구한다.

단계 2. 각 고유값 $\lambda_i$ 에 대하여 고유 공간 $\ker(A - \lambda_i I)$ 의 기저를 구한다. 기하적 중복도 $d_i = \dim(\ker(A - \lambda_i I))$ 를 확인한다.

단계 3. 모든 $i$ 에 대하여 $d_i = m_i$ 인지 검증한다. 하나라도 $d_i < m_i$ 이면 대각화 불가능이다.

단계 4. $d_i = m_i$ 가 모든 $i$ 에 대하여 성립하면, 각 고유 공간의 기저 벡터들을 모아 행렬 $P = (v_1 \mid v_2 \mid \cdots \mid v_n)$ 을 구성한다.

단계 5. $D = \text{diag}(\lambda_1, \ldots, \lambda_1, \lambda_2, \ldots, \lambda_2, \ldots, \lambda_k, \ldots, \lambda_k)$ 로 둔다. 각 $\lambda_i$ 는 $m_i$ 번 반복된다.

7. 구체적 계산 예시

행렬 $A = \begin{pmatrix} 4 & -2 \\ 1 & 1 \end{pmatrix}$ 을 대각화하라.

단계 1. 특성 다항식:

$\det(\lambda I - A) = (\lambda - 4)(\lambda - 1) + 2 = \lambda^2 - 5\lambda + 6 = (\lambda - 2)(\lambda - 3)$

고유값: $\lambda_1 = 2$ , $\lambda_2 = 3$ (각각 대수적 중복도 1).

단계 2. $\lambda_1 = 2$ :

$A - 2I = \begin{pmatrix} 2 & -2 \\ 1 & -1 \end{pmatrix} \implies v_1 = \begin{pmatrix} 1 \\ 1 \end{pmatrix}$

$\lambda_2 = 3$ :

$A - 3I = \begin{pmatrix} 1 & -2 \\ 1 & -2 \end{pmatrix} \implies v_2 = \begin{pmatrix} 2 \\ 1 \end{pmatrix}$

단계 3. 서로 다른 고유값 2개이므로 대각화 가능하다.

단계 4-5.

$P = \begin{pmatrix} 1 & 2 \\ 1 & 1 \end{pmatrix}, \quad D = \begin{pmatrix} 2 & 0 \\ 0 & 3 \end{pmatrix}$

검증: $P^{-1} = \begin{pmatrix} -1 & 2 \\ 1 & -1 \end{pmatrix}$ 이므로

$P^{-1}AP = \begin{pmatrix} -1 & 2 \\ 1 & -1 \end{pmatrix}\begin{pmatrix} 4 & -2 \\ 1 & 1 \end{pmatrix}\begin{pmatrix} 1 & 2 \\ 1 & 1 \end{pmatrix} = \begin{pmatrix} 2 & 0 \\ 0 & 3 \end{pmatrix} = D \quad \checkmark$

8. 대각화의 계산적 활용

대각화의 가장 직접적인 응용은 행렬의 거듭제곱 계산이다. $A = PDP^{-1}$ 이면

$A^k = PD^kP^{-1} = P \begin{pmatrix} \lambda_1^k & & \\ & \ddots & \\ & & \lambda_n^k \end{pmatrix} P^{-1}$

이 결과는 대각 행렬의 거듭제곱이 각 대각 성분의 거듭제곱으로 환원된다는 사실에 기반한다. 행렬 지수함수(matrix exponential) $e^{At}$ 의 계산에도 동일한 원리가 적용된다.

$e^{At} = P \begin{pmatrix} e^{\lambda_1 t} & & \\ & \ddots & \\ & & e^{\lambda_n t} \end{pmatrix} P^{-1}$

이러한 계산적 단순화는 대각화가 선형대수학과 그 응용에서 갖는 실용적 가치의 핵심이다.