29.16 유사 행렬(Similar Matrices)의 정의와 불변량 분석

1. 유사 행렬의 형식적 정의

n \times n 행렬 AB가 **유사(similar)**하다 함은 다음을 만족하는 가역 행렬 P \in M_{n \times n}(\mathbb{F})가 존재하는 것이다.

B = P^{-1} A P

이 관계가 성립할 때 A \sim B로 표기한다. 유사 관계의 핵심적 의미는 AB가 동일한 선형 변환 T : V \to V의 서로 다른 기저에서의 행렬 표현이라는 것이다.

2. 유사 관계의 동치 관계 성질

유사 관계 \simM_{n \times n}(\mathbb{F}) 위의 동치 관계(equivalence relation)이다.

반사성. A = I^{-1} A I이므로 A \sim A이다.

대칭성. B = P^{-1}AP이면 A = PBP^{-1} = (P^{-1})^{-1}B(P^{-1})이므로 A \sim B이면 B \sim A이다.

추이성. B = P^{-1}AP이고 C = Q^{-1}BQ이면

C = Q^{-1}(P^{-1}AP)Q = (PQ)^{-1}A(PQ)

PQ는 가역이므로 A \sim C이다.

따라서 \sim에 의한 동치류(equivalence class)가 정의되며, 각 동치류는 하나의 추상적 선형 변환에 대응한다.

3. 불변량의 개념

유사 행렬의 **불변량(invariant)**이란 유사 관계에 의해 보존되는 행렬의 성질 또는 값이다. 즉, A \sim B이면 해당 성질이나 값이 AB에서 동일하다. 불변량은 행렬 자체가 아닌 그 배후의 선형 변환에 고유한 성질을 포착한다.

4. 스칼라 불변량

4.1 대각합(Trace)

정리. A \sim B이면 \text{tr}(A) = \text{tr}(B)이다.

증명. B = P^{-1}AP이므로

\text{tr}(B) = \text{tr}(P^{-1}AP) = \text{tr}(APP^{-1}) = \text{tr}(A)

두 번째 등식에서 대각합의 순환 성질(cyclic property) \text{tr}(XYZ) = \text{tr}(ZXY)를 사용하였다. \blacksquare

대각합은 선형 변환 T에 대하여 기저의 선택과 무관한 값을 정의하며, 이를 \text{tr}(T)로 표기할 수 있다.

4.2 행렬식(Determinant)

정리. A \sim B이면 \det(A) = \det(B)이다.

증명. B = P^{-1}AP이므로

\det(B) = \det(P^{-1}AP) = \det(P^{-1})\det(A)\det(P) = \frac{1}{\det(P)} \cdot \det(A) \cdot \det(P) = \det(A)

\blacksquare

4.3 계수(Rank)

정리. A \sim B이면 \text{rank}(A) = \text{rank}(B)이다.

증명. 가역 행렬을 곱하는 것은 열 공간의 차원을 보존하는 가역 선형 사상이다. B = P^{-1}AP에서 PP^{-1}이 가역이므로

\text{rank}(B) = \text{rank}(P^{-1}AP) = \text{rank}(A)

\blacksquare

계수의 불변성으로부터 영 공간의 차원(nullity) 또한 불변이다. 이는 차원 정리(rank-nullity theorem)의 직접적 귀결이다.

5. 특성 다항식과 고유값의 불변성

5.1 특성 다항식(Characteristic Polynomial)

정리. A \sim B이면 AB의 특성 다항식은 동일하다.

\det(\lambda I - A) = \det(\lambda I - B)

증명.

\det(\lambda I - B) = \det(\lambda I - P^{-1}AP) = \det(P^{-1}(\lambda I - A)P) = \det(P^{-1})\det(\lambda I - A)\det(P) = \det(\lambda I - A)

\blacksquare

5.2 고유값(Eigenvalue)

특성 다항식이 동일하므로, 유사 행렬은 중복도(multiplicity)를 포함하여 동일한 고유값을 갖는다. 구체적으로, \lambdaA의 대수적 중복도(algebraic multiplicity) m인 고유값이면, B에서도 대수적 중복도 m인 고유값이다.

5.3 최소 다항식(Minimal Polynomial)

정리. A \sim B이면 AB의 최소 다항식은 동일하다.

증명. p(\lambda)A의 최소 다항식이라 하자. 즉, p(A) = 0이고 이 성질을 만족하는 최소 차수의 모닉(monic) 다항식이다. 유사 변환의 다항식 보존 성질에 의하여

p(B) = p(P^{-1}AP) = P^{-1}p(A)P = P^{-1} \cdot 0 \cdot P = 0

따라서 B의 최소 다항식은 p(\lambda)를 나눈다. 대칭 논법에 의해 B의 최소 다항식도 A의 최소 다항식을 나눈다. 양쪽 모두 모닉이므로 두 최소 다항식은 동일하다. \blacksquare

6. 구조적 불변량

6.1 고유 공간(Eigenspace)의 차원

각 고유값 \lambda_i에 대하여, 기하적 중복도(geometric multiplicity) \dim(\ker(A - \lambda_i I))는 유사 변환에 의한 불변량이다.

증명. B = P^{-1}AP이면

\ker(B - \lambda_i I) = \ker(P^{-1}AP - \lambda_i I) = \ker(P^{-1}(A - \lambda_i I)P)

P가 가역이므로 P^{-1}(A - \lambda_i I)PA - \lambda_i I는 유사하며, 따라서 동일한 계수를 갖는다. 차원 정리에 의해 영 공간의 차원도 동일하다. \blacksquare

6.2 조르당 표준형(Jordan Normal Form)

복소수체 \mathbb{C} 위에서 모든 정방 행렬은 유일한(순서를 제외하고) 조르당 표준형을 갖는다. 두 행렬이 유사할 필요충분조건은 동일한 조르당 표준형을 갖는 것이다. 따라서 조르당 표준형은 유사 관계의 **완전 불변량(complete invariant)**이다.

7. 유사 변환에 의해 보존되지 않는 성질

다음의 성질들은 유사 변환에 의해 일반적으로 보존되지 않는다.

대칭성. A가 대칭 행렬(A = A^T)이라 하여도 P^{-1}AP가 반드시 대칭인 것은 아니다. 대칭성은 기저에 의존하는 성질이다.

양의 정부호성(positive definiteness)의 행렬 원소에 의한 판별. 행렬의 개별 원소 a_{ij}는 기저에 의존하므로 유사 변환에 의해 변한다. 다만 양의 정부호성 자체는 고유값에 의해 결정되므로 불변이다.

희소성(sparsity). 행렬의 0이 아닌 원소의 패턴은 유사 변환에 의해 보존되지 않는다.

8. 불변량의 체계적 분류

유사 변환의 불변량을 체계적으로 분류하면 다음과 같다.

불변량정의비고
대각합(trace)\text{tr}(A) = \sum_{i} a_{ii}고유값의 합과 동일
행렬식(determinant)\det(A)고유값의 곱과 동일
계수(rank)\text{rank}(A)비영(非零) 고유값의 개수와 관련
특성 다항식\det(\lambda I - A)모든 고유값 정보를 인코딩
최소 다항식최소 차수의 소멸 다항식조르당 블록 크기 정보 포함
고유값 집합\sigma(A) = \{\lambda \vert \det(A - \lambda I) = 0\}중복도 포함
기하적 중복도\dim(\ker(A - \lambda_i I))각 고유값에 대해 정의
조르당 표준형조르당 블록의 구조완전 불변량

9. 불변량에 의한 유사성 판별

두 행렬의 유사성을 판별할 때, 불변량은 다음과 같이 활용된다.

필요조건으로서의 활용. 위에서 나열한 불변량 중 하나라도 다르면 두 행렬은 유사하지 않다. 예를 들어, \text{tr}(A) \neq \text{tr}(B)이면 A \not\sim B이다.

충분조건의 한계. 대각합, 행렬식, 특성 다항식이 모두 같더라도 두 행렬이 유사하지 않을 수 있다. 예를 들어

A = \begin{pmatrix} 0 & 1 \\ 0 & 0 \end{pmatrix}, \quad B = \begin{pmatrix} 0 & 0 \\ 0 & 0 \end{pmatrix}

은 동일한 특성 다항식 \lambda^2을 갖지만, \text{rank}(A) = 1 \neq 0 = \text{rank}(B)이므로 유사하지 않다. 완전한 유사성 판별에는 조르당 표준형의 비교가 필요하다.

10. 불변량 분석의 이론적 의의

불변량 분석은 선형대수학에서 좌표에 독립적인(coordinate-free) 이론을 구축하는 핵심 방법론이다. 행렬은 기저 선택에 의존하는 표현이지만, 불변량은 그 배후에 있는 선형 변환의 본질적 성질을 기저에 무관하게 포착한다.

이러한 관점은 딥러닝에서도 중요하다. 서로 다른 초기화(initialization)로부터 학습된 신경망의 가중치 행렬이 수치적으로 다르더라도, 불변량 분석을 통해 두 신경망이 본질적으로 동일한 선형 변환을 학습하였는지를 판별할 수 있다.