30.4 특성 방정식(Characteristic Equation)의 유도와 구조

1. 특성 방정식의 유도

고유값 방정식 $Av = \lambda v$ 를 $(A - \lambda I)v = 0$ 으로 변환한다. 이 동차 선형 계가 비영해 $v \neq 0$ 를 가지려면 계수 행렬 $A - \lambda I$ 가 비가역이어야 한다. 따라서

$\det(A - \lambda I) = 0$

이 등식을 $A$ 의 **특성 방정식(characteristic equation)**이라 한다. 관례에 따라 $\det(\lambda I - A) = 0$ 으로 쓰기도 하며, 이 경우 최고차 항의 계수가 양수가 된다.

2. 특성 다항식의 정의와 구조

2.1 정의

$n \times n$ 행렬 $A$ 의 **특성 다항식(characteristic polynomial)**은

$p_A(\lambda) = \det(\lambda I - A)$

로 정의된다. 이는 $\lambda$ 에 관한 $n$ 차 모닉(monic) 다항식이다.

2.2 일반적 구조

$p_A(\lambda) = \lambda^n - s_1 \lambda^{n-1} + s_2 \lambda^{n-2} - \cdots + (-1)^n s_n$

여기서 계수 $s_k$ 는 $A$ 의 $k \times k$ **주소행렬식(principal minor)**들의 합이다.

$s_1$ (1차 계수):

$s_1 = \text{tr}(A) = \sum_{i=1}^n a_{ii}$

$s_n$ (상수항):

$s_n = \det(A)$

$s_2$ (2차 계수):

$s_2 = \sum_{1 \leq i < j \leq n} \begin{vmatrix} a_{ii} & a_{ij} \\ a_{ji} & a_{jj} \end{vmatrix}$

3. 저차원 행렬의 특성 다항식

3.1 $2 \times 2$ 행렬

$A = \begin{pmatrix} a & b \\ c & d \end{pmatrix}$ 에 대하여

$p_A(\lambda) = \lambda^2 - (a+d)\lambda + (ad - bc) = \lambda^2 - \text{tr}(A)\lambda + \det(A)$

근의 공식에 의한 고유값:

$\lambda = \frac{\text{tr}(A) \pm \sqrt{(\text{tr}\, A)^2 - 4\det A}}{2}$

판별식 $\Delta = (\text{tr}\, A)^2 - 4\det A$ 에 따라:

$\Delta > 0$ : 서로 다른 두 실수 고유값
$\Delta = 0$ : 중복 실수 고유값
$\Delta < 0$ : 켤레 복소 고유값 쌍

3.2 $3 \times 3$ 행렬

$p_A(\lambda) = \lambda^3 - \text{tr}(A)\lambda^2 + s_2 \lambda - \det(A)$

3차 방정식의 근을 구하는 것은 일반적으로 카르다노 공식(Cardano’s formula)을 필요로 하며, 실용적으로는 수치적 방법이 사용된다.

4. 근과 계수의 관계(Vieta’s Formulas)

특성 다항식의 근이 $\lambda_1, \lambda_2, \ldots, \lambda_n$ (중복 포함)이면, 비에타 공식에 의하여

$\sum_{i=1}^n \lambda_i = \text{tr}(A)$

$\sum_{i < j} \lambda_i \lambda_j = s_2$

$\prod_{i=1}^n \lambda_i = \det(A)$

특히 대각합(trace)이 고유값의 합이고 행렬식(determinant)이 고유값의 곱이라는 관계는 고유값 이론에서 가장 기본적이고 유용한 성질이다.

5. 특성 다항식의 성질

5.1 유사 변환에 대한 불변성

정리. 유사 행렬은 동일한 특성 다항식을 갖는다. $B = P^{-1}AP$ 이면

$p_B(\lambda) = \det(\lambda I - P^{-1}AP) = \det(P^{-1}(\lambda I - A)P) = \det(\lambda I - A) = p_A(\lambda)$

따라서 특성 다항식(및 고유값)은 기저 선택에 무관한 선형 변환의 불변량이다.

5.2 전치에 대한 불변성

$p_{A^T}(\lambda) = \det(\lambda I - A^T) = \det((\lambda I - A)^T) = \det(\lambda I - A) = p_A(\lambda)$

$A$ 와 $A^T$ 는 동일한 고유값을 갖는다. 다만 고유벡터는 일반적으로 다르다.

5.3 블록 삼각 행렬

$A = \begin{pmatrix} A_{11} & A_{12} \\ 0 & A_{22} \end{pmatrix}$ 이면

$p_A(\lambda) = p_{A_{11}}(\lambda) \cdot p_{A_{22}}(\lambda)$

블록 삼각 행렬의 고유값은 대각 블록의 고유값을 합한 것이다.

6. 구체적 계산 예시

6.1 예시

$A = \begin{pmatrix} 1 & 2 & 0 \\ 0 & 3 & 0 \\ 2 & -4 & 2 \end{pmatrix}$

$\text{tr}(A) = 1 + 3 + 2 = 6$

$\det(A) = 1(6-0) - 2(0-0) + 0 = 6$

$s_2 = \begin{vmatrix} 1 & 2 \\ 0 & 3 \end{vmatrix} + \begin{vmatrix} 1 & 0 \\ 2 & 2 \end{vmatrix} + \begin{vmatrix} 3 & 0 \\ -4 & 2 \end{vmatrix} = 3 + 2 + 6 = 11$

$p_A(\lambda) = \lambda^3 - 6\lambda^2 + 11\lambda - 6 = (\lambda - 1)(\lambda - 2)(\lambda - 3)$

고유값: $\lambda_1 = 1$ , $\lambda_2 = 2$ , $\lambda_3 = 3$ .

검증: $1 + 2 + 3 = 6 = \text{tr}(A)$ , $1 \cdot 2 \cdot 3 = 6 = \det(A)$ . $\checkmark$

7. 특성 방정식의 한계와 수치적 고려

$n \geq 5$ 인 경우, 아벨-루피니 정리(Abel-Ruffini theorem)에 의하여 일반적인 $n$ 차 다항식은 근호(radical)를 이용한 닫힌 형태의 해를 갖지 않는다. 따라서 $5 \times 5$ 이상의 행렬에서 고유값을 대수적으로 구하는 것은 일반적으로 불가능하며, QR 알고리즘 등의 반복 수치 알고리즘이 필요하다.

또한 특성 다항식의 계수를 구한 후 근을 찾는 방법은 수치적으로 불안정하다. 다항식의 근은 계수의 작은 섭동에 민감하게 반응할 수 있기 때문이다(윌킨슨 다항식, Wilkinson’s polynomial). 이러한 이유로 현대의 고유값 계산에서는 특성 다항식을 명시적으로 구하지 않는 반복 알고리즘이 표준적으로 사용된다.