30.5 특성 다항식(Characteristic Polynomial)의 정의와 차수 분석
1. 특성 다항식의 형식적 정의
A \in M_{n \times n}(\mathbb{F})가 n \times n 정방 행렬일 때, A의 **특성 다항식(characteristic polynomial)**은 다음과 같이 정의된다.
p_A(\lambda) = \det(\lambda I - A)
이는 변수 \lambda에 관한 n차 다항식이다. 관례에 따라 \det(\lambda I - A)를 사용하면 최고차 계수가 1인 모닉(monic) 다항식이 되고, \det(A - \lambda I)를 사용하면 최고차 계수가 (-1)^n이 된다. 본 서적에서는 전자의 관례를 따른다.
2. 차수의 결정
2.1 n차 다항식의 도출
\lambda I - A는 n \times n 행렬이며, 그 (i,j) 성분은
(\lambda I - A)_{ij} = \begin{cases} \lambda - a_{ii} & \text{if } i = j \\ -a_{ij} & \text{if } i \neq j \end{cases}
행렬식 \det(\lambda I - A)를 라이프니츠 공식(Leibniz formula)으로 전개하면
\det(\lambda I - A) = \sum_{\sigma \in S_n} \text{sgn}(\sigma) \prod_{i=1}^{n} (\lambda I - A)_{i,\sigma(i)}
여기서 S_n은 n개 원소의 치환(permutation) 전체의 집합이다.
\lambda의 최고차 항은 항등 치환 \sigma = \text{id}에서만 발생한다.
\prod_{i=1}^{n} (\lambda - a_{ii}) = \lambda^n - \left(\sum_{i=1}^n a_{ii}\right)\lambda^{n-1} + \cdots
다른 모든 치환에서는 \lambda를 포함하는 대각 원소가 최소 2개 누락되므로 \lambda의 차수가 n-2 이하이다. 따라서 p_A(\lambda)는 정확히 n차 모닉 다항식이다.
\deg(p_A) = n
3. 특성 다항식의 계수 구조
3.1 일반적 전개
p_A(\lambda) = \lambda^n - s_1 \lambda^{n-1} + s_2 \lambda^{n-2} - \cdots + (-1)^k s_k \lambda^{n-k} + \cdots + (-1)^n s_n
여기서 (-1)^k s_k는 \lambda^{n-k}의 계수이다. 각 s_k는 A의 k차 주소행렬식(principal minor)들의 합이다.
3.2 최고차 계수
\text{leading coefficient} = 1
p_A(\lambda)는 항상 모닉이다.
3.3 차최고차 계수: 대각합(Trace)
s_1 = \text{tr}(A) = \sum_{i=1}^n a_{ii}
따라서 \lambda^{n-1}의 계수는 -\text{tr}(A)이다.
증명. \prod_{i=1}^n (\lambda - a_{ii})를 전개하면 \lambda^{n-1}의 계수는 -\sum_i a_{ii}이다. 비항등 치환의 기여는 \lambda^{n-2} 이하의 차수이므로 \lambda^{n-1}의 계수에 영향을 주지 않는다. \blacksquare
3.4 상수항: 행렬식(Determinant)
s_n = \det(A)
p_A(0) = \det(0 \cdot I - A) = \det(-A) = (-1)^n \det(A)이므로, 상수항은 (-1)^n \det(A)이다. 이는 (-1)^n s_n과 일치한다.
3.5 차 계수
s_2 = \sum_{1 \leq i < j \leq n} \left(a_{ii}a_{jj} - a_{ij}a_{ji}\right) = \sum_{1 \leq i < j \leq n} \det\begin{pmatrix} a_{ii} & a_{ij} \\ a_{ji} & a_{jj} \end{pmatrix}
이는 A의 모든 2 \times 2 주소 부분 행렬(principal submatrix)의 행렬식의 합이다.
4. 고유값과 특성 다항식의 근
4.1 인수 분해
대수학의 기본 정리에 의하여, \mathbb{C} 위에서 특성 다항식은 일차 인수의 곱으로 완전히 인수 분해된다.
p_A(\lambda) = (\lambda - \lambda_1)^{m_1}(\lambda - \lambda_2)^{m_2} \cdots (\lambda - \lambda_k)^{m_k}
여기서 \lambda_1, \lambda_2, \ldots, \lambda_k는 서로 다른 고유값이고, m_i는 \lambda_i의 **대수적 중복도(algebraic multiplicity)**이다.
\sum_{i=1}^k m_i = n
4.2 근과 계수의 관계
비에타 공식(Vieta’s formulas)에 의하여
s_1 = \sum_{i=1}^k m_i \lambda_i = \text{tr}(A)
s_n = \prod_{i=1}^k \lambda_i^{m_i} = \det(A)
5. 저차원 행렬의 특성 다항식
5.1 1 \times 1 행렬
A = (a)이면 p_A(\lambda) = \lambda - a. 유일한 고유값 \lambda = a.
5.2 2 \times 2 행렬
A = \begin{pmatrix} a & b \\ c & d \end{pmatrix}이면
p_A(\lambda) = \lambda^2 - (a+d)\lambda + (ad-bc) = \lambda^2 - \text{tr}(A)\lambda + \det(A)
고유값: \lambda = \frac{\text{tr}(A) \pm \sqrt{(\text{tr}\,A)^2 - 4\det A}}{2}
5.3 3 \times 3 행렬
p_A(\lambda) = \lambda^3 - s_1\lambda^2 + s_2\lambda - s_3
여기서 s_1 = \text{tr}(A), s_3 = \det(A), s_2는 위에서 정의한 2 \times 2 주소행렬식의 합이다.
6. 특성 다항식의 불변성 성질
6.1 유사 변환에 대한 불변
정리. B = P^{-1}AP이면 p_B(\lambda) = p_A(\lambda).
증명.
p_B(\lambda) = \det(\lambda I - P^{-1}AP) = \det(P^{-1}(\lambda I - A)P) = \det(P^{-1})\det(\lambda I - A)\det(P) = p_A(\lambda)
\blacksquare
이 불변성은 특성 다항식이 행렬이 아닌 선형 변환의 본질적 성질을 기술함을 의미한다.
6.2 전치에 대한 불변
p_{A^T}(\lambda) = p_A(\lambda). 이는 \det(\lambda I - A^T) = \det((\lambda I - A)^T) = \det(\lambda I - A)로부터 즉시 도출된다.
7. 차수 분석의 의의
특성 다항식의 차수가 정확히 n이라는 사실은 다음의 중요한 귀결을 갖는다.
첫째, \mathbb{C} 위에서 n \times n 행렬은 정확히 n개의 고유값(중복 포함)을 갖는다. 이는 대수학의 기본 정리의 직접적 적용이다.
둘째, \mathbb{R} 위에서는 고유값의 개수가 n보다 적을 수 있다. 특성 다항식의 실수 근의 수는 0개부터 n개까지 가능하다.
셋째, 특성 다항식의 차수 n은 고유값의 대수적 중복도의 총합과 같다. 이는 대수적 중복도에 대한 제약 \sum m_i = n을 부여한다.
넷째, n \geq 5인 경우 아벨-루피니 정리(Abel-Ruffini theorem)에 의하여 일반적인 n차 다항식의 근을 근호(radical)로 표현할 수 없다. 따라서 5 \times 5 이상의 일반 행렬에서 고유값의 대수적 닫힌 형태(closed-form) 해는 존재하지 않으며, 수치적 알고리즘이 필수적이다.