30.5 특성 다항식(Characteristic Polynomial)의 정의와 차수 분석

30.5 특성 다항식(Characteristic Polynomial)의 정의와 차수 분석

1. 특성 다항식의 형식적 정의

A \in M_{n \times n}(\mathbb{F})n \times n 정방 행렬일 때, A의 **특성 다항식(characteristic polynomial)**은 다음과 같이 정의된다.

p_A(\lambda) = \det(\lambda I - A)

이는 변수 \lambda에 관한 n차 다항식이다. 관례에 따라 \det(\lambda I - A)를 사용하면 최고차 계수가 1인 모닉(monic) 다항식이 되고, \det(A - \lambda I)를 사용하면 최고차 계수가 (-1)^n이 된다. 본 서적에서는 전자의 관례를 따른다.

2. 차수의 결정

2.1 n차 다항식의 도출

\lambda I - An \times n 행렬이며, 그 (i,j) 성분은

(\lambda I - A)_{ij} = \begin{cases} \lambda - a_{ii} & \text{if } i = j \\ -a_{ij} & \text{if } i \neq j \end{cases}

행렬식 \det(\lambda I - A)를 라이프니츠 공식(Leibniz formula)으로 전개하면

\det(\lambda I - A) = \sum_{\sigma \in S_n} \text{sgn}(\sigma) \prod_{i=1}^{n} (\lambda I - A)_{i,\sigma(i)}

여기서 S_nn개 원소의 치환(permutation) 전체의 집합이다.

\lambda의 최고차 항은 항등 치환 \sigma = \text{id}에서만 발생한다.

\prod_{i=1}^{n} (\lambda - a_{ii}) = \lambda^n - \left(\sum_{i=1}^n a_{ii}\right)\lambda^{n-1} + \cdots

다른 모든 치환에서는 \lambda를 포함하는 대각 원소가 최소 2개 누락되므로 \lambda의 차수가 n-2 이하이다. 따라서 p_A(\lambda)는 정확히 n차 모닉 다항식이다.

\deg(p_A) = n

3. 특성 다항식의 계수 구조

3.1 일반적 전개

p_A(\lambda) = \lambda^n - s_1 \lambda^{n-1} + s_2 \lambda^{n-2} - \cdots + (-1)^k s_k \lambda^{n-k} + \cdots + (-1)^n s_n

여기서 (-1)^k s_k\lambda^{n-k}의 계수이다. 각 s_kAk차 주소행렬식(principal minor)들의 합이다.

3.2 최고차 계수

\text{leading coefficient} = 1

p_A(\lambda)는 항상 모닉이다.

3.3 차최고차 계수: 대각합(Trace)

s_1 = \text{tr}(A) = \sum_{i=1}^n a_{ii}

따라서 \lambda^{n-1}의 계수는 -\text{tr}(A)이다.

증명. \prod_{i=1}^n (\lambda - a_{ii})를 전개하면 \lambda^{n-1}의 계수는 -\sum_i a_{ii}이다. 비항등 치환의 기여는 \lambda^{n-2} 이하의 차수이므로 \lambda^{n-1}의 계수에 영향을 주지 않는다. \blacksquare

3.4 상수항: 행렬식(Determinant)

s_n = \det(A)

p_A(0) = \det(0 \cdot I - A) = \det(-A) = (-1)^n \det(A)이므로, 상수항은 (-1)^n \det(A)이다. 이는 (-1)^n s_n과 일치한다.

3.5 차 계수

s_2 = \sum_{1 \leq i < j \leq n} \left(a_{ii}a_{jj} - a_{ij}a_{ji}\right) = \sum_{1 \leq i < j \leq n} \det\begin{pmatrix} a_{ii} & a_{ij} \\ a_{ji} & a_{jj} \end{pmatrix}

이는 A의 모든 2 \times 2 주소 부분 행렬(principal submatrix)의 행렬식의 합이다.

4. 고유값과 특성 다항식의 근

4.1 인수 분해

대수학의 기본 정리에 의하여, \mathbb{C} 위에서 특성 다항식은 일차 인수의 곱으로 완전히 인수 분해된다.

p_A(\lambda) = (\lambda - \lambda_1)^{m_1}(\lambda - \lambda_2)^{m_2} \cdots (\lambda - \lambda_k)^{m_k}

여기서 \lambda_1, \lambda_2, \ldots, \lambda_k는 서로 다른 고유값이고, m_i\lambda_i의 **대수적 중복도(algebraic multiplicity)**이다.

\sum_{i=1}^k m_i = n

4.2 근과 계수의 관계

비에타 공식(Vieta’s formulas)에 의하여

s_1 = \sum_{i=1}^k m_i \lambda_i = \text{tr}(A)

s_n = \prod_{i=1}^k \lambda_i^{m_i} = \det(A)

5. 저차원 행렬의 특성 다항식

5.1 1 \times 1 행렬

A = (a)이면 p_A(\lambda) = \lambda - a. 유일한 고유값 \lambda = a.

5.2 2 \times 2 행렬

A = \begin{pmatrix} a & b \\ c & d \end{pmatrix}이면

p_A(\lambda) = \lambda^2 - (a+d)\lambda + (ad-bc) = \lambda^2 - \text{tr}(A)\lambda + \det(A)

고유값: \lambda = \frac{\text{tr}(A) \pm \sqrt{(\text{tr}\,A)^2 - 4\det A}}{2}

5.3 3 \times 3 행렬

p_A(\lambda) = \lambda^3 - s_1\lambda^2 + s_2\lambda - s_3

여기서 s_1 = \text{tr}(A), s_3 = \det(A), s_2는 위에서 정의한 2 \times 2 주소행렬식의 합이다.

6. 특성 다항식의 불변성 성질

6.1 유사 변환에 대한 불변

정리. B = P^{-1}AP이면 p_B(\lambda) = p_A(\lambda).

증명.

p_B(\lambda) = \det(\lambda I - P^{-1}AP) = \det(P^{-1}(\lambda I - A)P) = \det(P^{-1})\det(\lambda I - A)\det(P) = p_A(\lambda)

\blacksquare

이 불변성은 특성 다항식이 행렬이 아닌 선형 변환의 본질적 성질을 기술함을 의미한다.

6.2 전치에 대한 불변

p_{A^T}(\lambda) = p_A(\lambda). 이는 \det(\lambda I - A^T) = \det((\lambda I - A)^T) = \det(\lambda I - A)로부터 즉시 도출된다.

7. 차수 분석의 의의

특성 다항식의 차수가 정확히 n이라는 사실은 다음의 중요한 귀결을 갖는다.

첫째, \mathbb{C} 위에서 n \times n 행렬은 정확히 n개의 고유값(중복 포함)을 갖는다. 이는 대수학의 기본 정리의 직접적 적용이다.

둘째, \mathbb{R} 위에서는 고유값의 개수가 n보다 적을 수 있다. 특성 다항식의 실수 근의 수는 0개부터 n개까지 가능하다.

셋째, 특성 다항식의 차수 n은 고유값의 대수적 중복도의 총합과 같다. 이는 대수적 중복도에 대한 제약 \sum m_i = n을 부여한다.

넷째, n \geq 5인 경우 아벨-루피니 정리(Abel-Ruffini theorem)에 의하여 일반적인 n차 다항식의 근을 근호(radical)로 표현할 수 없다. 따라서 5 \times 5 이상의 일반 행렬에서 고유값의 대수적 닫힌 형태(closed-form) 해는 존재하지 않으며, 수치적 알고리즘이 필수적이다.