30.1 고유값 문제(Eigenvalue Problem)의 정의와 연구 동기
1. 고유값 문제의 형식적 정의
V를 체 \mathbb{F} 위의 벡터 공간이라 하고, T : V \to V를 선형 변환이라 하자. 스칼라 \lambda \in \mathbb{F}가 T의 **고유값(eigenvalue)**이라 함은 다음을 만족하는 비영 벡터 v \in V (v \neq 0)가 존재하는 것이다.
T(v) = \lambda v
이 조건을 만족하는 비영 벡터 v를 고유값 \lambda에 대응하는 **고유벡터(eigenvector)**라 한다.
행렬의 언어로 표현하면, n \times n 행렬 A에 대하여 **고유값 문제(eigenvalue problem)**는
Av = \lambda v, \quad v \neq 0
을 만족하는 스칼라 \lambda와 벡터 v의 쌍 (\lambda, v)를 구하는 문제이다.
2. 고유값 방정식의 동치적 표현
Av = \lambda v는 (A - \lambda I)v = 0으로 변환된다. 비영해 v가 존재하려면
\ker(A - \lambda I) \neq \{0\}
이어야 하며, 이는
\det(A - \lambda I) = 0
과 동치이다. 이 행렬식 조건이 고유값을 결정하는 방정식이다.
3. 특성 다항식
3.1 정의
n \times n 행렬 A의 **특성 다항식(characteristic polynomial)**은
p(\lambda) = \det(\lambda I - A)
으로 정의된다. p(\lambda)는 \lambda에 관한 n차 다항식이며, 최고차 계수가 1인 모닉(monic) 다항식이다.
p(\lambda) = \lambda^n - (\text{tr}\, A)\lambda^{n-1} + \cdots + (-1)^n \det A
3.2 고유값과 특성 다항식의 관계
\lambda_0가 A의 고유값일 필요충분조건은 p(\lambda_0) = 0이다. 따라서 **고유값은 특성 다항식의 근(root)**이다.
대수학의 기본 정리(fundamental theorem of algebra)에 의하여, \mathbb{C} 위에서 n차 특성 다항식은 정확히 n개의 근(중복 포함)을 가진다. 따라서 복소수체 위에서 n \times n 행렬은 항상 n개의 고유값(중복 포함)을 갖는다.
4. 고유값의 기하학적 의미
고유벡터 v는 선형 변환 T에 의해 방향이 보존되는 벡터이다. T(v) = \lambda v에서:
- \lambda > 0: v 방향으로 \lambda배 신장. 방향 불변.
- \lambda < 0: v 방향으로 |\lambda|배 신장 후 반전. 방향 역전.
- \lambda = 1: v는 T의 고정점(변환에 의해 불변).
- \lambda = 0: v는 핵(kernel)에 속한다. T에 의해 소멸.
5. 연구 동기
5.1 행렬 분해의 기반
고유값 분해 A = PDP^{-1}은 행렬을 대각 행렬이라는 최대한 단순한 형태로 환원한다. 이를 통해 행렬의 거듭제곱 A^k = PD^kP^{-1}, 행렬 지수함수 e^{At} = Pe^{Dt}P^{-1} 등의 계산이 대폭 간소화된다.
5.2 동역학 계의 안정성 분석
선형 상미분 방정식 \dot{x} = Ax의 해는 x(t) = e^{At}x_0이며, 시스템의 안정성은 A의 고유값에 의해 결정된다. 모든 고유값의 실수 부분이 음수이면 시스템은 안정적(stable)이고, 양수인 고유값이 하나라도 있으면 불안정(unstable)하다.
5.3 주성분 분석과 차원 축소
데이터의 공분산 행렬의 고유값은 각 주성분 방향의 분산을 나타낸다. 큰 고유값에 대응하는 고유벡터 방향이 데이터의 주요 변동 방향이며, 이를 이용한 차원 축소가 주성분 분석(PCA)의 핵심이다.
5.4 딥러닝에서의 의의
신경망의 가중치 행렬과 헤시안 행렬의 고유 분석은 다음의 핵심 질문에 답한다.
- 기울기 소실/폭발은 어느 방향에서 발생하는가? (가중치 행렬의 고유값)
- 손실 함수의 곡률이 각 방향에서 어떠한가? (헤시안의 고유값)
- 학습된 표현의 주요 변동 방향은 무엇인가? (활성화 공분산의 고유벡터)
5.5 그래프 이론과 스펙트럼 분석
그래프의 인접 행렬이나 라플라시안 행렬의 고유 분석은 그래프의 구조적 성질(연결성, 클러스터링, 확산 특성)을 드러낸다. 그래프 신경망(GNN)의 스펙트럼 방법은 이러한 고유 분석에 직접 기반한다.
6. 고유값 문제의 역사적 맥락
고유값 문제의 기원은 18세기 오일러(Euler)의 강체 회전 연구와 라그랑주(Lagrange)의 미분 방정식 풀이로 거슬러 올라간다. “고유(eigen)“라는 용어는 독일어로 “고유한, 본래의(own, proper)“를 의미하며, 1904년 힐베르트(Hilbert)가 적분 방정식 연구에서 처음 사용하였다. 이후 양자역학에서 관측 가능량(observable)의 측정값이 자기 수반 연산자의 고유값에 해당한다는 발견으로 물리학에서도 핵심 개념이 되었다.