30.4 특성 방정식(Characteristic Equation)의 유도와 구조
1. 특성 방정식의 유도
고유값 방정식 Av = \lambda v를 (A - \lambda I)v = 0으로 변환한다. 이 동차 선형 계가 비영해 v \neq 0를 가지려면 계수 행렬 A - \lambda I가 비가역이어야 한다. 따라서
\det(A - \lambda I) = 0
이 등식을 A의 **특성 방정식(characteristic equation)**이라 한다. 관례에 따라 \det(\lambda I - A) = 0으로 쓰기도 하며, 이 경우 최고차 항의 계수가 양수가 된다.
2. 특성 다항식의 정의와 구조
2.1 정의
n \times n 행렬 A의 **특성 다항식(characteristic polynomial)**은
p_A(\lambda) = \det(\lambda I - A)
로 정의된다. 이는 \lambda에 관한 n차 모닉(monic) 다항식이다.
2.2 일반적 구조
p_A(\lambda) = \lambda^n - s_1 \lambda^{n-1} + s_2 \lambda^{n-2} - \cdots + (-1)^n s_n
여기서 계수 s_k는 A의 k \times k **주소행렬식(principal minor)**들의 합이다.
s_1 (1차 계수):
s_1 = \text{tr}(A) = \sum_{i=1}^n a_{ii}
s_n (상수항):
s_n = \det(A)
s_2 (2차 계수):
s_2 = \sum_{1 \leq i < j \leq n} \begin{vmatrix} a_{ii} & a_{ij} \\ a_{ji} & a_{jj} \end{vmatrix}
3. 저차원 행렬의 특성 다항식
3.1 2 \times 2 행렬
A = \begin{pmatrix} a & b \\ c & d \end{pmatrix}에 대하여
p_A(\lambda) = \lambda^2 - (a+d)\lambda + (ad - bc) = \lambda^2 - \text{tr}(A)\lambda + \det(A)
근의 공식에 의한 고유값:
\lambda = \frac{\text{tr}(A) \pm \sqrt{(\text{tr}\, A)^2 - 4\det A}}{2}
판별식 \Delta = (\text{tr}\, A)^2 - 4\det A에 따라:
- \Delta > 0: 서로 다른 두 실수 고유값
- \Delta = 0: 중복 실수 고유값
- \Delta < 0: 켤레 복소 고유값 쌍
3.2 3 \times 3 행렬
p_A(\lambda) = \lambda^3 - \text{tr}(A)\lambda^2 + s_2 \lambda - \det(A)
3차 방정식의 근을 구하는 것은 일반적으로 카르다노 공식(Cardano’s formula)을 필요로 하며, 실용적으로는 수치적 방법이 사용된다.
4. 근과 계수의 관계(Vieta’s Formulas)
특성 다항식의 근이 \lambda_1, \lambda_2, \ldots, \lambda_n (중복 포함)이면, 비에타 공식에 의하여
\sum_{i=1}^n \lambda_i = \text{tr}(A)
\sum_{i < j} \lambda_i \lambda_j = s_2
\prod_{i=1}^n \lambda_i = \det(A)
특히 대각합(trace)이 고유값의 합이고 행렬식(determinant)이 고유값의 곱이라는 관계는 고유값 이론에서 가장 기본적이고 유용한 성질이다.
5. 특성 다항식의 성질
5.1 유사 변환에 대한 불변성
정리. 유사 행렬은 동일한 특성 다항식을 갖는다. B = P^{-1}AP이면
p_B(\lambda) = \det(\lambda I - P^{-1}AP) = \det(P^{-1}(\lambda I - A)P) = \det(\lambda I - A) = p_A(\lambda)
따라서 특성 다항식(및 고유값)은 기저 선택에 무관한 선형 변환의 불변량이다.
5.2 전치에 대한 불변성
p_{A^T}(\lambda) = \det(\lambda I - A^T) = \det((\lambda I - A)^T) = \det(\lambda I - A) = p_A(\lambda)
A와 A^T는 동일한 고유값을 갖는다. 다만 고유벡터는 일반적으로 다르다.
5.3 블록 삼각 행렬
A = \begin{pmatrix} A_{11} & A_{12} \\ 0 & A_{22} \end{pmatrix}이면
p_A(\lambda) = p_{A_{11}}(\lambda) \cdot p_{A_{22}}(\lambda)
블록 삼각 행렬의 고유값은 대각 블록의 고유값을 합한 것이다.
6. 구체적 계산 예시
6.1 예시
A = \begin{pmatrix} 1 & 2 & 0 \\ 0 & 3 & 0 \\ 2 & -4 & 2 \end{pmatrix}
\text{tr}(A) = 1 + 3 + 2 = 6
\det(A) = 1(6-0) - 2(0-0) + 0 = 6
s_2 = \begin{vmatrix} 1 & 2 \\ 0 & 3 \end{vmatrix} + \begin{vmatrix} 1 & 0 \\ 2 & 2 \end{vmatrix} + \begin{vmatrix} 3 & 0 \\ -4 & 2 \end{vmatrix} = 3 + 2 + 6 = 11
p_A(\lambda) = \lambda^3 - 6\lambda^2 + 11\lambda - 6 = (\lambda - 1)(\lambda - 2)(\lambda - 3)
고유값: \lambda_1 = 1, \lambda_2 = 2, \lambda_3 = 3.
검증: 1 + 2 + 3 = 6 = \text{tr}(A), 1 \cdot 2 \cdot 3 = 6 = \det(A). \checkmark
7. 특성 방정식의 한계와 수치적 고려
n \geq 5인 경우, 아벨-루피니 정리(Abel-Ruffini theorem)에 의하여 일반적인 n차 다항식은 근호(radical)를 이용한 닫힌 형태의 해를 갖지 않는다. 따라서 5 \times 5 이상의 행렬에서 고유값을 대수적으로 구하는 것은 일반적으로 불가능하며, QR 알고리즘 등의 반복 수치 알고리즘이 필요하다.
또한 특성 다항식의 계수를 구한 후 근을 찾는 방법은 수치적으로 불안정하다. 다항식의 근은 계수의 작은 섭동에 민감하게 반응할 수 있기 때문이다(윌킨슨 다항식, Wilkinson’s polynomial). 이러한 이유로 현대의 고유값 계산에서는 특성 다항식을 명시적으로 구하지 않는 반복 알고리즘이 표준적으로 사용된다.