6.32 특성 방정식과 고유값 계산

1. 특성 방정식의 도입

특성 방정식(characteristic equation)은 행렬의 고유값을 다항식의 근으로 정의하는 방정식이며, 고유값 계산의 가장 기본적이고 이론적으로 명확한 출발점이다. 본 절에서는 특성 다항식의 정의, 그 성질, 작은 차수 행렬에 대한 명시적 계산, 일반적인 수치 계산 방법, 그리고 로봇공학에서의 응용을 체계적으로 다룬다.

2. 특성 다항식의 정의

정의 6.32.1 (특성 다항식). $n \times n$ 정방 행렬 $A$ 의 특성 다항식(characteristic polynomial)은 다음과 같이 정의된다.

$p_A(\lambda) = \det(\lambda I - A)$

또는 동치적으로

$p_A(\lambda) = \det(A - \lambda I)$

(부호의 차이는 $(-1)^n$ 이며 근은 같다)

특성 다항식은 $\lambda$ 에 관한 $n$ 차 다항식이며, 그 근이 $A$ 의 고유값이다.

정의 6.32.2 (특성 방정식). 방정식

$p_A(\lambda) = 0$

을 $A$ 의 특성 방정식이라 한다. 이 방정식의 해가 행렬 $A$ 의 모든 고유값이다.

특성 다항식의 일반 형태

$n$ 차 특성 다항식은 다음과 같이 전개된다.

$p_A(\lambda) = \lambda^n - c_1 \lambda^{n-1} + c_2 \lambda^{n-2} - \cdots + (-1)^n c_n$

여기서 계수 $c_k$ 는 다음과 같은 의미를 가진다.

$c_1 = \text{tr}(A)$ : 모든 주요 1차 소행렬식의 합 (대각합)
$c_2$ : 모든 주요 2차 소행렬식의 합
$\vdots$
$c_n = \det(A)$ : 행렬식

특히

$p_A(\lambda) = \lambda^n - \text{tr}(A) \cdot \lambda^{n-1} + \cdots + (-1)^n \det(A)$

이 일반 형태는 두 가지 중요한 결과를 즉시 함의한다.

결과 1: 모든 고유값의 합은 대각합과 같다.

$\sum_{i=1}^{n} \lambda_i = \text{tr}(A)$

결과 2: 모든 고유값의 곱은 행렬식과 같다.

$\prod_{i=1}^{n} \lambda_i = \det(A)$

이는 행렬을 명시적으로 대각화하지 않고도 고유값의 합과 곱을 즉시 알 수 있게 한다.

작은 차수의 명시적 계산

2 $\times$ 2 행렬

$A = \begin{bmatrix} a & b \\ c & d \end{bmatrix}$

특성 다항식은

$p_A(\lambda) = (a - \lambda)(d - \lambda) - bc = \lambda^2 - (a + d)\lambda + (ad - bc)$

또는

$p_A(\lambda) = \lambda^2 - \text{tr}(A) \lambda + \det(A)$

이로부터 고유값은 이차 방정식의 근의 공식으로

$\lambda_{1,2} = \frac{\text{tr}(A) \pm \sqrt{\text{tr}(A)^2 - 4 \det(A)}}{2}$

판별식 $\text{tr}(A)^2 - 4 \det(A)$ 의 부호에 따라 다음의 경우가 발생한다.

판별식 $> 0$ : 두 개의 서로 다른 실수 고유값
판별식 $= 0$ : 하나의 중근 (대수적 중복도 2)
판별식 $< 0$ : 두 개의 켤레 복소 고유값

3 $\times$ 3 행렬

3 $\times$ 3 행렬의 특성 다항식은 일반적으로

$p_A(\lambda) = -\lambda^3 + c_1 \lambda^2 - c_2 \lambda + c_3$

여기서 (부호 약속에 따라)

$c_1 = \text{tr}(A) = a_{11} + a_{22} + a_{33}$
$c_2 = $ (모든 주요 2 $\times$ 2 소행렬식의 합) $= (a_{11}a_{22} - a_{12}a_{21}) + (a_{11}a_{33} - a_{13}a_{31}) + (a_{22}a_{33} - a_{23}a_{32})$
$c_3 = \det(A)$

3차 다항식의 근은 카르다노 공식으로 구할 수 있으나, 일반적으로 수치적 방법이 사용된다.

3. 계산 예시

3.1 예시 1: 2 $\times$ 2 대칭 행렬

$A = \begin{bmatrix} 4 & 1 \\ 1 & 3 \end{bmatrix}$

특성 다항식:

$p_A(\lambda) = \lambda^2 - 7\lambda + 11$

고유값:

$\lambda = \frac{7 \pm \sqrt{49 - 44}}{2} = \frac{7 \pm \sqrt{5}}{2}$

대칭 행렬이므로 두 실수 고유값을 가진다.

예시 2: 회전 행렬

$R = \begin{bmatrix} \cos\theta & -\sin\theta \\ \sin\theta & \cos\theta \end{bmatrix}$

특성 다항식:

$p_R(\lambda) = (\cos\theta - \lambda)^2 + \sin^2\theta = \lambda^2 - 2\cos\theta \cdot \lambda + 1$

판별식: $4\cos^2\theta - 4 = -4\sin^2\theta$ . $\theta \neq 0, \pi$ 이면 음수이므로 복소 고유값을 가진다.

$\lambda = \cos\theta \pm i \sin\theta = e^{\pm i\theta}$

이는 회전이 어떤 실수 방향도 보존하지 않음을 반영한다.

3.2 예시 3: 3 $\times$ 3 상삼각 행렬

$A = \begin{bmatrix} 2 & 1 & 5 \\ 0 & 3 & 7 \\ 0 & 0 & 4 \end{bmatrix}$

상삼각 행렬의 특성 다항식은

$p_A(\lambda) = (2 - \lambda)(3 - \lambda)(4 - \lambda)$

이므로 고유값은 대각 성분 $\lambda_1 = 2, \lambda_2 = 3, \lambda_3 = 4$ 이다.

일반화: 임의의 (상 또는 하) 삼각 행렬의 고유값은 대각 성분과 같다. 이 사실은 대각화 알고리즘이 행렬을 점진적으로 삼각 형태로 환원하여 고유값을 추출하는 핵심 아이디어이다.

4. 특성 다항식의 성질

4.1 닮음 변환에 대한 불변성

$B = P^{-1} A P$ 이면 $A$ 와 $B$ 는 같은 특성 다항식을 가진다.

증명. $\det(\lambda I - B) = \det(\lambda I - P^{-1} A P) = \det(P^{-1}(\lambda I - A) P) = \det(P^{-1}) \det(\lambda I - A) \det(P) = \det(\lambda I - A)$ $\square$

이로부터 닮음 변환은 고유값을 보존한다는 결과가 직접 따라 나온다.

4.2 케일리-해밀턴 정리

정리 6.32.1 (케일리-해밀턴 정리). 임의의 정방 행렬은 자신의 특성 방정식을 만족한다. 즉, 특성 다항식 $p_A(\lambda)$ 에 대해

$p_A(A) = O$

이 성립한다. 여기서 $p_A(A)$ 는 다항식 $p_A$ 의 변수 $\lambda$ 를 행렬 $A$ 로 치환한 결과이며, 결과는 영행렬이다.

이 정리는 행렬의 거듭제곱과 역행렬을 작은 차수의 다항식으로 표현할 수 있게 한다. 예를 들어 $n \times n$ 가역 행렬 $A$ 에 대해

$A^{-1} = -\frac{1}{c_n} (A^{n-1} - c_1 A^{n-2} + \cdots + (-1)^{n-1} c_{n-1} I)$

로 표현된다. 또한 모든 거듭제곱 $A^k$ ( $k \geq n$ )는 $I, A, A^2, \ldots, A^{n-1}$ 의 선형 결합으로 표현된다.

4.3 특성 다항식의 계수와 고유값

$\lambda_1, \ldots, \lambda_n$ 이 모든 고유값(중복 포함)이라 하면 $p_A(\lambda) = \prod_{i=1}^n (\lambda - \lambda_i)$ 이며, 비에타 공식에 의해

$c_1 = \sum_i \lambda_i = \text{tr}(A)$

$c_2 = \sum_{i < j} \lambda_i \lambda_j$

$\vdots$

$c_n = \prod_i \lambda_i = \det(A)$

이러한 대칭 다항식 표현은 고유값의 부분 정보를 얻는 데 활용된다.

5. 수치 계산 방법

5.1 작은 행렬 ( $n \leq 4$ )

2 $\times$ 2와 3 $\times$ 3 행렬은 특성 다항식의 근을 명시적 공식으로 직접 계산할 수 있다. 4 $\times$ 4 행렬은 4차 다항식이며, 페라리 공식으로 명시적으로 풀 수 있지만 복잡하다.

5.2 큰 행렬에 대한 한계

$n \geq 5$ 의 일반 행렬에 대해서는 다항식 방정식의 일반적 명시적 풀이가 불가능하다 (아벨-루피니 정리). 따라서 큰 행렬의 고유값 계산은 다항식 풀이가 아닌 다른 접근이 필요하다.

또한 특성 다항식의 직접 계산과 풀이는 수치적으로 매우 불안정하다. 다항식의 근은 계수의 작은 변화에 매우 민감하기 때문이다 (일커슨 다항식의 예 참조). 이로 인해 실용적인 고유값 계산은 특성 다항식을 우회하는 반복 알고리즘에 기반한다.

5.3 거듭제곱 방법

가장 간단한 반복 방법은 거듭제곱 방법(power method)이다. 임의의 초기 벡터 $\mathbf{x}_0$ 에서 시작하여

$\mathbf{x}_{k+1} = \frac{A \mathbf{x}_k}{\|A \mathbf{x}_k\|}$

을 반복하면 $\mathbf{x}_k$ 는 가장 큰 절댓값을 가지는 고유값에 대응하는 고유벡터로 수렴한다. 대응하는 고유값은 레일리 몫(Rayleigh quotient)

$\lambda \approx \frac{\mathbf{x}_k^\top A \mathbf{x}_k}{\mathbf{x}_k^\top \mathbf{x}_k}$

으로 추정된다. 거듭제곱 방법은 PageRank 알고리즘과 같은 응용에 사용되지만, 모든 고유값을 구하지는 못한다.

5.4 QR 알고리즘

모든 고유값을 구하는 표준적인 수치 방법은 QR 알고리즘이다. 알고리즘의 기본 형태는 다음과 같다.

$A_0 = A$ 로 시작
각 $k$ 에 대해 $A_k = Q_k R_k$ (QR 분해)를 수행
$A_{k+1} = R_k Q_k$ 로 갱신

이 반복 하에 $A_k$ 는 (적절한 조건 하에) 상삼각 행렬로 수렴하며, 그 대각 성분이 $A$ 의 고유값이 된다. 수렴 가속을 위해 시프트(shift) 전략, 헤센베르크 형태로의 사전 환원, 디플레이션(deflation) 등이 결합된다. 실용적인 LAPACK 등의 라이브러리는 이러한 최적화된 QR 알고리즘을 사용한다.

5.5 자코비 회전 방법

대칭 행렬에 대해서는 자코비 방법이 사용될 수 있다. 자코비 방법은 적절히 선택된 일련의 직교 변환을 통해 비대각 성분을 점진적으로 0으로 만들어 결국 대각 행렬을 얻는다. QR 알고리즘보다 느리지만 매우 정확하며, 작은 대칭 행렬에 적합하다.

5.6 분할 정복

대칭 삼중대각 행렬에 대해서는 분할 정복(divide-and-conquer) 알고리즘이 사용된다. 큰 행렬을 작은 부분 문제로 분할하고, 부분 해를 결합하여 전체 해를 얻는다. 이 방법은 GPU 병렬화에 적합하다.

6. 특수 경우의 고유값

6.1 대각 행렬

대각 행렬의 고유값은 대각 성분과 같다.

$\lambda_i = d_i$

대응하는 고유벡터는 표준 기저 벡터 $\mathbf{e}_i$ 이다.

삼각 행렬

상 또는 하삼각 행렬의 고유값은 대각 성분과 같다. 그러나 고유벡터는 일반적으로 표준 기저가 아니다.

직교 행렬

직교 행렬 $Q$ 의 모든 고유값은 절댓값이 1이며, 복소수일 수 있다 ( $|\lambda| = 1$ ). 회전 행렬의 경우 고유값은 $1, e^{i\theta}, e^{-i\theta}$ 형태이다.

대칭 행렬

대칭 행렬의 모든 고유값은 실수이다 (스펙트럼 정리).

양정치 대칭 행렬

대칭 양정치 행렬의 모든 고유값은 양수이다.

멱영 행렬

$A^k = O$ 인 어떤 $k$ 가 존재하면 $A$ 의 모든 고유값은 0이다.

대합 행렬

$A^2 = I$ 인 행렬의 고유값은 $\pm 1$ 이다.

로봇공학에서의 응용

강체의 관성 텐서 분석

강체의 관성 텐서의 특성 방정식을 풀어 주관성 모멘트를 결정한다. 이는 자세 동역학의 단순화, 자유 회전 운동의 안정성 분석, 운동 에너지의 효율적 표현에 사용된다.

진동 시스템의 고유 주파수

선형화된 진동 시스템 $M\ddot{\mathbf{q}} + K\mathbf{q} = \mathbf{0}$ 의 고유 주파수는 일반화된 고유값 문제 $K\mathbf{u} = \omega^2 M \mathbf{u}$ 또는 동치적으로 $M^{-1} K$ 의 특성 다항식의 근으로 결정된다.

제어 시스템의 안정성

선형 시스템 $\dot{\mathbf{x}} = A \mathbf{x}$ 의 안정성은 $A$ 의 특성 다항식의 근이 모두 좌측 복소 평면(실수부가 음수)에 위치하는지로 판정된다. 라우스-허위츠(Routh-Hurwitz) 안정성 판정법은 특성 다항식의 계수만으로 이를 검사하는 표준 도구이다.

극 배치 제어

극 배치(pole placement) 제어 설계는 폐루프 시스템의 특성 다항식의 근을 원하는 위치로 이동시키는 입력을 설계하는 것이다. 이는 직접적으로 특성 방정식의 풀이 및 변형에 의존한다.

회전 행렬의 축-각도 추출

회전 행렬 $R$ 의 특성 방정식 $\lambda^3 - (\text{tr}(R))\lambda^2 + (\text{tr}(R))\lambda - 1 = 0$ 의 한 근은 항상 1이다. 이에 대응하는 고유벡터가 회전축이며, $\cos\theta = (\text{tr}(R) - 1)/2$ 로부터 회전각이 결정된다.

칼만 필터의 안정성 보장

칼만 필터의 폐루프 시스템의 특성 다항식의 안정성은 필터의 점근적 거동을 보장하는 데 필요하며, 이산 시간 시스템에서는 모든 고유값이 단위 원 내부에 있어야 한다.

가조작성 분석

매니퓰레이터의 자코비안과 그 변형 ( $JJ^\top$ , $J^\top J$ )의 고유값은 가조작성 타원체의 형상을 결정한다. 가장 작은 고유값이 0에 가까워지면 특이점에 가까워짐을 의미한다.

점 군 정합과 형상 분석

점 군의 공분산 행렬의 특성 방정식의 근(고유값)은 점 분포의 주축의 길이를 나타내며, 형상의 평면성, 선형성, 등방성을 정량화하는 데 사용된다.

참고문헌

Strang, G. (2023). Introduction to Linear Algebra (6th ed.). Wellesley-Cambridge Press.
Golub, G. H., & Van Loan, C. F. (2013). Matrix Computations (4th ed.). Johns Hopkins University Press.
Trefethen, L. N., & Bau, D. (1997). Numerical Linear Algebra. SIAM.
Horn, R. A., & Johnson, C. R. (2012). Matrix Analysis (2nd ed.). Cambridge University Press.

Version: 1.0