30.17 대각화 불가능 행렬의 판별과 결함 행렬(Defective Matrix)의 특성

30.17 대각화 불가능 행렬의 판별과 결함 행렬(Defective Matrix)의 특성

1. 결함 행렬의 정의

n \times n 행렬 A가 **결함 행렬(defective matrix)**이라 함은 A가 대각화 불가능한 것, 즉 n개의 일차독립 고유벡터를 갖지 못하는 것이다. 동치적으로, 적어도 하나의 고유값 \lambda_i에서 기하학적 중복도가 대수적 중복도보다 엄밀히 작다.

\exists \, i : \quad d_i < m_i

고유값 \lambda_i의 **결손(defect)**은 m_i - d_i로 정의되며, 행렬의 **총 결손(total defect)**은

\text{defect}(A) = \sum_{i=1}^k (m_i - d_i) = n - \sum_{i=1}^k d_i

이다. A가 결함 행렬일 필요충분조건은 \text{defect}(A) > 0인 것이다.

2. 대각화 불가능의 판별 절차

2.1 절차

단계 1. 특성 다항식 p_A(\lambda)를 구하여 고유값과 대수적 중복도를 결정한다.

단계 2. 모든 고유값이 단순(대수적 중복도 1)이면 즉시 대각화 가능으로 판정한다. (고유벡터 계산 불필요)

단계 3. 중복 고유값 \lambda_i (m_i \geq 2)가 존재하면, 각각에 대하여 \text{rank}(A - \lambda_i I)를 계산하여 기하학적 중복도 d_i = n - \text{rank}(A - \lambda_i I)를 구한다.

단계 4. d_i = m_i가 모든 i에서 성립하면 대각화 가능, 아니면 불가능(결함 행렬)으로 판정한다.

2.2 단순화된 판별법

정리. A가 결함 행렬일 필요조건은 특성 다항식이 중복근을 가지는 것이다. 즉, 모든 고유값이 단순이면 A는 반드시 대각화 가능하다.

따라서 중복근이 없으면 결함 행렬 판별 절차를 수행할 필요가 없다.

3. 결함 행렬의 전형적 예시

3.1 예시 1: 2 \times 2 조르당 블록

J_2(\lambda) = \begin{pmatrix} \lambda & 1 \\ 0 & \lambda \end{pmatrix}

p(\mu) = (\mu - \lambda)^2. m = 2. J_2(\lambda) - \lambda I = \begin{pmatrix} 0 & 1 \\ 0 & 0 \end{pmatrix}, \text{rank} = 1, d = 1. d < m.

3.2 예시 2: 3 \times 3 조르당 블록

J_3(\lambda) = \begin{pmatrix} \lambda & 1 & 0 \\ 0 & \lambda & 1 \\ 0 & 0 & \lambda \end{pmatrix}

m = 3. \text{rank}(J_3 - \lambda I) = 2, d = 1.

3.3 예시 3: 혼합 구조

A = \begin{pmatrix} 2 & 1 & 0 \\ 0 & 2 & 0 \\ 0 & 0 & 5 \end{pmatrix}

p_A(\lambda) = (\lambda - 2)^2(\lambda - 5). \lambda_1 = 2: m_1 = 2, d_1 = 1. \lambda_2 = 5: m_2 = 1, d_2 = 1.

d_1 = 1 < m_1 = 2이므로 결함 행렬이다. 총 결손 = 1.

4. 결함 행렬의 대수적 특성화

4.1 최소 다항식에 의한 판별

정리. A가 대각화 가능할 필요충분조건은 A의 최소 다항식(minimal polynomial) \mu_A(\lambda)가 일차 인수의 곱으로 분해되며 중복 인수가 없는 것이다.

A \text{가 대각화 가능} \quad \Leftrightarrow \quad \mu_A(\lambda) = (\lambda - \lambda_1)(\lambda - \lambda_2) \cdots (\lambda - \lambda_k)

A가 결함 행렬이면 최소 다항식에 (\lambda - \lambda_i)^{s_i} (s_i \geq 2)인 인수가 존재한다.

4.2 예시를 통한 확인

J_2(2) = \begin{pmatrix} 2 & 1 \\ 0 & 2 \end{pmatrix}: 특성 다항식 (\lambda - 2)^2, 최소 다항식 (\lambda - 2)^2. 최소 다항식에 중복 인수가 있으므로 결함 행렬.

2I_2 = \begin{pmatrix} 2 & 0 \\ 0 & 2 \end{pmatrix}: 특성 다항식 (\lambda - 2)^2, 최소 다항식 (\lambda - 2). 최소 다항식에 중복 인수가 없으므로 대각화 가능.

5. 결함 행렬의 기하학적 특성

5.1 불변 직선의 부족

대각화 가능한 n \times n 행렬은 n개의 일차독립 불변 직선(고유벡터 방향)을 갖는다. 결함 행렬은 이러한 불변 직선의 수가 n보다 적다.

5.2 전단 성분의 존재

결함 행렬의 작용에는 순수 스케일링으로 환원되지 않는 전단(shearing) 성분이 본질적으로 존재한다. 조르당 블록의 초대각(superdiagonal) 원소 1이 이 전단을 나타낸다.

J_2(\lambda)\begin{pmatrix} x_1 \\ x_2 \end{pmatrix} = \begin{pmatrix} \lambda x_1 + x_2 \\ \lambda x_2 \end{pmatrix}

x_2 성분이 x_1의 출력에 영향을 미치는 결합이 존재한다.

5.3 거듭제곱에서의 다항식적 성장

대각화 가능한 행렬의 거듭제곱은 순수 지수적: (PDP^{-1})^k = PD^kP^{-1}에서 각 성분이 \lambda_i^k로 행동한다.

결함 행렬의 거듭제곱은 다항식-지수적(polynomial-exponential) 성장을 보인다.

J_2(\lambda)^k = \begin{pmatrix} \lambda^k & k\lambda^{k-1} \\ 0 & \lambda^k \end{pmatrix}

초대각 성분에 k\lambda^{k-1}이 나타나 다항식적 인수 k가 곱해진다.

6. 조르당 표준형과의 관계

결함 행렬을 가장 단순한 형태로 환원하면 **조르당 표준형(Jordan normal form)**을 얻는다.

A = PJP^{-1}, \quad J = \begin{pmatrix} J_{n_1}(\lambda_{i_1}) & & \\ & J_{n_2}(\lambda_{i_2}) & \\ & & \ddots \end{pmatrix}

여기서 J_s(\lambda)s \times s 조르당 블록이다. 대각화 가능한 행렬의 조르당 표준형은 대각 행렬이다(모든 블록이 1 \times 1).

고유값 \lambda_i에 대응하는 조르당 블록의 수가 기하학적 중복도 d_i이고, 블록 크기의 합이 대수적 중복도 m_i이다. 결손 m_i - d_i는 크기 2 이상인 조르당 블록의 초대각 원소의 총 수이다.

7. 결함 행렬의 실용적 의의

결함 행렬은 수치적으로 불안정한 성질을 갖는다. 작은 섭동에 의해 결함 행렬이 대각화 가능한 행렬로 변할 수 있으며(고유값이 분리됨), 이 과정에서 고유벡터가 불연속적으로 변한다.

딥러닝에서 가중치 행렬이 결함 행렬에 가까운 경우, 기울기 전파에서 다항식적 성장 요인이 발생하여 학습이 불안정해질 수 있다. 이는 결함 행렬의 조르당 블록 구조에 기인하며, 가중치 행렬의 스펙트럼 분석에서 주의가 필요한 경우이다.