30.5 특성 다항식(Characteristic Polynomial)의 정의와 차수 분석

1. 특성 다항식의 형식적 정의

$A \in M_{n \times n}(\mathbb{F})$ 가 $n \times n$ 정방 행렬일 때, $A$ 의 **특성 다항식(characteristic polynomial)**은 다음과 같이 정의된다.

$p_A(\lambda) = \det(\lambda I - A)$

이는 변수 $\lambda$ 에 관한 $n$ 차 다항식이다. 관례에 따라 $\det(\lambda I - A)$ 를 사용하면 최고차 계수가 $1$ 인 모닉(monic) 다항식이 되고, $\det(A - \lambda I)$ 를 사용하면 최고차 계수가 $(-1)^n$ 이 된다. 본 서적에서는 전자의 관례를 따른다.

2. 차수의 결정

2.1 $n$ 차 다항식의 도출

$\lambda I - A$ 는 $n \times n$ 행렬이며, 그 $(i,j)$ 성분은

$(\lambda I - A)_{ij} = \begin{cases} \lambda - a_{ii} & \text{if } i = j \\ -a_{ij} & \text{if } i \neq j \end{cases}$

행렬식 $\det(\lambda I - A)$ 를 라이프니츠 공식(Leibniz formula)으로 전개하면

$\det(\lambda I - A) = \sum_{\sigma \in S_n} \text{sgn}(\sigma) \prod_{i=1}^{n} (\lambda I - A)_{i,\sigma(i)}$

여기서 $S_n$ 은 $n$ 개 원소의 치환(permutation) 전체의 집합이다.

$\lambda$ 의 최고차 항은 항등 치환 $\sigma = \text{id}$ 에서만 발생한다.

$\prod_{i=1}^{n} (\lambda - a_{ii}) = \lambda^n - \left(\sum_{i=1}^n a_{ii}\right)\lambda^{n-1} + \cdots$

다른 모든 치환에서는 $\lambda$ 를 포함하는 대각 원소가 최소 2개 누락되므로 $\lambda$ 의 차수가 $n-2$ 이하이다. 따라서 $p_A(\lambda)$ 는 정확히 $n$ 차 모닉 다항식이다.

$\deg(p_A) = n$

3. 특성 다항식의 계수 구조

3.1 일반적 전개

$p_A(\lambda) = \lambda^n - s_1 \lambda^{n-1} + s_2 \lambda^{n-2} - \cdots + (-1)^k s_k \lambda^{n-k} + \cdots + (-1)^n s_n$

여기서 $(-1)^k s_k$ 는 $\lambda^{n-k}$ 의 계수이다. 각 $s_k$ 는 $A$ 의 $k$ 차 주소행렬식(principal minor)들의 합이다.

3.2 최고차 계수

$\text{leading coefficient} = 1$

$p_A(\lambda)$ 는 항상 모닉이다.

3.3 차최고차 계수: 대각합(Trace)

$s_1 = \text{tr}(A) = \sum_{i=1}^n a_{ii}$

따라서 $\lambda^{n-1}$ 의 계수는 $-\text{tr}(A)$ 이다.

증명. $\prod_{i=1}^n (\lambda - a_{ii})$ 를 전개하면 $\lambda^{n-1}$ 의 계수는 $-\sum_i a_{ii}$ 이다. 비항등 치환의 기여는 $\lambda^{n-2}$ 이하의 차수이므로 $\lambda^{n-1}$ 의 계수에 영향을 주지 않는다. $\blacksquare$

3.4 상수항: 행렬식(Determinant)

$s_n = \det(A)$

$p_A(0) = \det(0 \cdot I - A) = \det(-A) = (-1)^n \det(A)$ 이므로, 상수항은 $(-1)^n \det(A)$ 이다. 이는 $(-1)^n s_n$ 과 일치한다.

3.5 차 계수

$s_2 = \sum_{1 \leq i < j \leq n} \left(a_{ii}a_{jj} - a_{ij}a_{ji}\right) = \sum_{1 \leq i < j \leq n} \det\begin{pmatrix} a_{ii} & a_{ij} \\ a_{ji} & a_{jj} \end{pmatrix}$

이는 $A$ 의 모든 $2 \times 2$ 주소 부분 행렬(principal submatrix)의 행렬식의 합이다.

4. 고유값과 특성 다항식의 근

4.1 인수 분해

대수학의 기본 정리에 의하여, $\mathbb{C}$ 위에서 특성 다항식은 일차 인수의 곱으로 완전히 인수 분해된다.

$p_A(\lambda) = (\lambda - \lambda_1)^{m_1}(\lambda - \lambda_2)^{m_2} \cdots (\lambda - \lambda_k)^{m_k}$

여기서 $\lambda_1, \lambda_2, \ldots, \lambda_k$ 는 서로 다른 고유값이고, $m_i$ 는 $\lambda_i$ 의 **대수적 중복도(algebraic multiplicity)**이다.

$\sum_{i=1}^k m_i = n$

4.2 근과 계수의 관계

비에타 공식(Vieta’s formulas)에 의하여

$s_1 = \sum_{i=1}^k m_i \lambda_i = \text{tr}(A)$

$s_n = \prod_{i=1}^k \lambda_i^{m_i} = \det(A)$

5. 저차원 행렬의 특성 다항식

5.1 $1 \times 1$ 행렬

$A = (a)$ 이면 $p_A(\lambda) = \lambda - a$ . 유일한 고유값 $\lambda = a$ .

5.2 $2 \times 2$ 행렬

$A = \begin{pmatrix} a & b \\ c & d \end{pmatrix}$ 이면

$p_A(\lambda) = \lambda^2 - (a+d)\lambda + (ad-bc) = \lambda^2 - \text{tr}(A)\lambda + \det(A)$

고유값: $\lambda = \frac{\text{tr}(A) \pm \sqrt{(\text{tr}\,A)^2 - 4\det A}}{2}$

5.3 $3 \times 3$ 행렬

$p_A(\lambda) = \lambda^3 - s_1\lambda^2 + s_2\lambda - s_3$

여기서 $s_1 = \text{tr}(A)$ , $s_3 = \det(A)$ , $s_2$ 는 위에서 정의한 $2 \times 2$ 주소행렬식의 합이다.

6. 특성 다항식의 불변성 성질

6.1 유사 변환에 대한 불변

정리. $B = P^{-1}AP$ 이면 $p_B(\lambda) = p_A(\lambda)$ .

증명.

$p_B(\lambda) = \det(\lambda I - P^{-1}AP) = \det(P^{-1}(\lambda I - A)P) = \det(P^{-1})\det(\lambda I - A)\det(P) = p_A(\lambda)$

$\blacksquare$

이 불변성은 특성 다항식이 행렬이 아닌 선형 변환의 본질적 성질을 기술함을 의미한다.

6.2 전치에 대한 불변

$p_{A^T}(\lambda) = p_A(\lambda)$ . 이는 $\det(\lambda I - A^T) = \det((\lambda I - A)^T) = \det(\lambda I - A)$ 로부터 즉시 도출된다.

7. 차수 분석의 의의

특성 다항식의 차수가 정확히 $n$ 이라는 사실은 다음의 중요한 귀결을 갖는다.

첫째, $\mathbb{C}$ 위에서 $n \times n$ 행렬은 정확히 $n$ 개의 고유값(중복 포함)을 갖는다. 이는 대수학의 기본 정리의 직접적 적용이다.

둘째, $\mathbb{R}$ 위에서는 고유값의 개수가 $n$ 보다 적을 수 있다. 특성 다항식의 실수 근의 수는 0개부터 $n$ 개까지 가능하다.

셋째, 특성 다항식의 차수 $n$ 은 고유값의 대수적 중복도의 총합과 같다. 이는 대수적 중복도에 대한 제약 $\sum m_i = n$ 을 부여한다.

넷째, $n \geq 5$ 인 경우 아벨-루피니 정리(Abel-Ruffini theorem)에 의하여 일반적인 $n$ 차 다항식의 근을 근호(radical)로 표현할 수 없다. 따라서 $5 \times 5$ 이상의 일반 행렬에서 고유값의 대수적 닫힌 형태(closed-form) 해는 존재하지 않으며, 수치적 알고리즘이 필수적이다.