6.56 조르단 표준형과 일반화된 고유 공간
1. 도입
조르단 표준형은 모든 정방 행렬에 대해 존재하는 가장 단순한 형태의 표준형으로, 행렬이 대각화 가능하지 않은 경우에도 그 구조를 명확히 드러낸다. 일반화된 고유 공간의 개념을 통해 비대각화 가능 행렬을 다루는 일관된 틀을 제공하며, 행렬의 대수적 구조와 동역학적 성질을 통합적으로 이해할 수 있게 한다. 로봇 제어 시스템의 임계 안정성 분석, 결함이 있는 시스템의 거동 분석, 그리고 행렬 함수의 정확한 계산에서 조르단 표준형은 이론적 기반을 제공한다.
2. 일반화된 고유벡터
행렬 A \in \mathbb{C}^{n \times n} 와 그 고유값 \lambda 에 대하여, 어떤 양의 정수 k 가 존재하여 다음을 만족하는 영이 아닌 벡터 \mathbf{v} 를 계수 k 의 일반화된 고유벡터(generalized eigenvector)라 한다.
(A - \lambda I)^k \mathbf{v} = \mathbf{0}, \quad (A - \lambda I)^{k-1} \mathbf{v} \ne \mathbf{0}
계수 1 의 일반화된 고유벡터는 일반적인 고유벡터와 일치한다. 일반화된 고유벡터의 집합은 일반적인 고유벡터의 자연스러운 확장이며, 비대각화 가능 행렬의 구조를 분석하는 핵심 도구이다.
3. 일반화된 고유 공간
고유값 \lambda 에 대한 일반화된 고유 공간(generalized eigenspace)은 다음과 같이 정의된다.
\mathcal{G}_{\lambda}(A) = \ker\left( (A - \lambda I)^n \right) = \{ \mathbf{v} \in \mathbb{C}^n : (A - \lambda I)^k \mathbf{v} = \mathbf{0} \text{ for some } k \ge 1 \}
이 공간의 차원은 정확히 \lambda 의 대수적 중복도와 일치한다. 일반화된 고유 공간은 일반적인 고유 공간 E_{\lambda} = \ker(A - \lambda I) 를 포함하며, A 가 대각화 가능할 때만 두 공간이 일치한다.
4. 일반화된 고유 공간 분해
정리(일반화된 고유 공간 분해 정리): A \in \mathbb{C}^{n \times n} 의 서로 다른 고유값을 \lambda_1, \lambda_2, \dots, \lambda_k 라 할 때, \mathbb{C}^n 은 일반화된 고유 공간들의 직합으로 분해된다.
\mathbb{C}^n = \mathcal{G}_{\lambda_1}(A) \oplus \mathcal{G}_{\lambda_2}(A) \oplus \cdots \oplus \mathcal{G}_{\lambda_k}(A)
각 일반화된 고유 공간 \mathcal{G}_{\lambda_i}(A) 는 A 에 대해 불변이며, A 의 작용을 각 부분 공간으로 제한할 수 있다. 이 분해는 비대각화 가능 행렬에 대해서도 항상 성립하는 보편적 분해이다.
5. 조르단 블록
크기 m \times m 의 조르단 블록(Jordan block)은 다음과 같은 형태의 상삼각 행렬이다.
J_m(\lambda) = \begin{pmatrix} \lambda & 1 & 0 & \cdots & 0 \\ 0 & \lambda & 1 & \cdots & 0 \\ \vdots & & \ddots & \ddots & \vdots \\ 0 & 0 & \cdots & \lambda & 1 \\ 0 & 0 & \cdots & 0 & \lambda \end{pmatrix}
대각 원소는 모두 \lambda 이며, 부대각선 원소는 모두 1 이고 나머지 원소는 0 이다. 크기 1 의 조르단 블록은 단순히 1 \times 1 행렬 (\lambda) 이며, 이는 일반적인 고유값에 해당한다.
조르단 블록 J_m(\lambda) 는 정확히 하나의 고유값 \lambda 를 가지며, 그 대수적 중복도는 m 이고 기하적 중복도는 1 이다. 따라서 m \ge 2 인 조르단 블록은 결함 행렬이며 대각화가 불가능하다.
6. 조르단 표준형
정리(조르단 표준형 정리): 임의의 행렬 A \in \mathbb{C}^{n \times n} 에 대하여, 가역 행렬 P 가 존재하여 다음을 만족한다.
A = P J P^{-1}
여기서 J 는 다음과 같은 블록 대각 형태이다.
J = \begin{pmatrix} J_{m_1}(\lambda_{i_1}) & & & \\ & J_{m_2}(\lambda_{i_2}) & & \\ & & \ddots & \\ & & & J_{m_p}(\lambda_{i_p}) \end{pmatrix}
각 J_{m_j}(\lambda_{i_j}) 는 조르단 블록이며, 블록의 크기와 고유값의 배치를 제외한 표현은 유일하다. 행렬 J 를 A 의 조르단 표준형(Jordan canonical form)이라 한다.
이 정리는 모든 정방 행렬이 조르단 블록들의 직합으로 표현될 수 있음을 보장하며, 비대각화 가능 행렬을 다루는 가장 강력한 도구이다.
7. 조르단 사슬
조르단 블록 J_m(\lambda) 에 대응하는 일반화된 고유벡터들의 집합을 조르단 사슬(Jordan chain)이라 한다. 길이 m 의 조르단 사슬은 다음 관계를 만족하는 벡터들의 수열이다.
(A - \lambda I) \mathbf{v}_k = \mathbf{v}_{k-1}, \quad k = 2, 3, \dots, m
(A - \lambda I) \mathbf{v}_1 = \mathbf{0}
여기서 \mathbf{v}_1 은 일반적인 고유벡터이며, \mathbf{v}_2, \mathbf{v}_3, \dots, \mathbf{v}_m 은 각각 계수 2, 3, \dots, m 의 일반화된 고유벡터이다. 이 사슬을 변환 행렬 P 의 열로 사용하면 해당 부분이 정확히 조르단 블록 J_m(\lambda) 의 형태로 변환된다.
8. 조르단 구조의 결정
특정 고유값 \lambda 에 대한 조르단 블록의 개수와 크기는 다음 점화 공식으로 결정된다. r_k = \mathrm{rank}\left( (A - \lambda I)^k \right) 라 정의할 때, 크기가 정확히 k 인 조르단 블록의 개수는 다음과 같다.
n_k(\lambda) = r_{k-1} - 2r_k + r_{k+1}
또한 \lambda 에 대응하는 조르단 블록의 총 개수는 기하적 중복도 \dim \ker(A - \lambda I) = n - r_1 과 일치한다. 가장 큰 조르단 블록의 크기는 \lambda 의 지표(index)라 하며, (A - \lambda I)^k = (A - \lambda I)^{k+1} 이 되는 가장 작은 k 와 같다.
9. 대수적 중복도와 기하적 중복도
조르단 표준형은 두 중복도의 차이를 구체화한다. 고유값 \lambda 의 대수적 중복도 a(\lambda) 는 일반화된 고유 공간 \mathcal{G}_{\lambda}(A) 의 차원, 즉 \lambda 에 대응하는 모든 조르단 블록의 크기의 합과 같다. 기하적 중복도 g(\lambda) 는 \dim \ker(A - \lambda I), 즉 \lambda 에 대응하는 조르단 블록의 개수와 같다.
따라서 항상 g(\lambda) \le a(\lambda) 가 성립하며, 등식은 모든 조르단 블록의 크기가 1 일 때, 즉 \lambda 에 대해 A 가 대각화 가능할 때만 성립한다. 만약 모든 고유값에 대해 g(\lambda) = a(\lambda) 이면 A 전체가 대각화 가능하다.
10. 조르단 표준형의 멱
조르단 블록의 멱은 명시적인 폐형식으로 계산된다. J_m(\lambda)^k 의 (i, j) 성분 (i \le j)은 다음과 같다.
\left[ J_m(\lambda)^k \right]_{ij} = \binom{k}{j-i} \lambda^{k - (j-i)}
여기서 \binom{k}{l} = 0 (l > k 또는 l < 0)으로 약속한다. 이 공식은 비대각화 가능 행렬의 멱 계산에 직접 활용되며, 이산 시간 시스템의 시간 응답 분석에 사용된다.
11. 행렬 지수 함수와 조르단 형식
조르단 블록의 지수 함수도 폐형식으로 표현된다.
e^{J_m(\lambda) t} = e^{\lambda t} \begin{pmatrix} 1 & t & \frac{t^2}{2!} & \cdots & \frac{t^{m-1}}{(m-1)!} \\ 0 & 1 & t & \cdots & \frac{t^{m-2}}{(m-2)!} \\ \vdots & & \ddots & \ddots & \vdots \\ 0 & 0 & \cdots & 1 & t \\ 0 & 0 & \cdots & 0 & 1 \end{pmatrix}
이 식은 비대각화 가능 행렬에 의해 결정되는 동역학 시스템의 시간 응답이 단순한 지수 함수가 아니라 다항식과 지수 함수의 곱으로 나타남을 보여준다. 이러한 항을 영년 항(secular term)이라 하며, 임계 안정 시스템의 다항식적 발산을 설명한다.
12. 조르단 표준형의 수치적 한계
조르단 표준형은 이론적으로 매우 강력하지만, 수치 계산에서는 본질적인 어려움이 있다. 행렬의 미세한 섭동만으로도 조르단 블록의 구조가 급격히 변할 수 있어 수치적으로 불안정하다. 이러한 이유로 실제 수치 계산에서는 조르단 표준형 대신 슈어 분해를 사용하는 것이 일반적이며, 조르단 표준형은 주로 이론적 분석과 기호적 계산에 활용된다.
13. 최소 다항식과의 관계
행렬 A 의 최소 다항식 m_A(\lambda) 는 조르단 표준형으로부터 직접 결정된다. 각 고유값 \lambda_i 에 대해 A 의 가장 큰 조르단 블록의 크기를 k_i 라 할 때, 다음이 성립한다.
m_A(\lambda) = \prod_{i=1}^{r} (\lambda - \lambda_i)^{k_i}
여기서 \lambda_1, \lambda_2, \dots, \lambda_r 은 A 의 서로 다른 고유값들이다. 최소 다항식은 항상 특성 다항식을 나누며, A 가 대각화 가능할 때만 두 다항식의 차수가 같다(겹근이 있는 경우 최소 다항식은 단순근만 가짐).
14. 로봇공학에서의 응용
14.1 임계 안정 시스템의 동역학 분석
로봇 제어 시스템의 선형화 모델이 허수축 위에 결함이 있는 고유값을 가질 경우, 조르단 표준형을 통해 시스템 거동을 정확히 분석할 수 있다. 고유값이 허수축 위에 단순근으로 존재하면 진동 응답을 생성하지만, 결함 고유값(조르단 블록 크기 \ge 2)이 존재하면 시스템 응답에 시간에 비례하여 증가하는 영년 항이 발생한다. 이러한 분석은 한계적으로 안정한 시스템의 미세한 매개변수 변동에 대한 민감도를 평가하는 데 사용된다.
14.2 결함이 있는 진동 시스템
가요성 매니퓰레이터의 일부 진동 모드가 임계 감쇠 상태에 가까울 경우, 시스템 행렬이 결함 고유값을 가질 수 있다. 이러한 모드는 일반적인 지수 감쇠 형태가 아닌 t e^{-\zeta \omega t} 형태의 응답을 보이며, 조르단 표준형 분석을 통해 그 거동을 정확히 예측할 수 있다.
14.3 칼만 가관측성과 정준형
선형 시스템의 가관측성과 가제어성 분석에서 조르단 정준형은 표준적 도구이다. 시스템을 조르단 표준형으로 변환하면 각 모드의 가관측성과 가제어성을 직접적으로 판별할 수 있으며, 이는 센서 및 작동기 배치 최적화에 활용된다.
14.4 모델 축소와 평형 절단
선형 시스템의 모델 축소 알고리즘에서 조르단 표준형은 어떤 모드를 제거하거나 보존할지 결정하는 이론적 기반을 제공한다. 결함 고유값에 대응하는 모드의 처리는 표준적 평형 절단과 다르며, 별도의 조심스러운 처리가 요구된다.
14.5 비선형 정규형 이론
비선형 로봇 제어 시스템의 정규형 이론은 조르단 표준형의 비선형 확장으로 볼 수 있다. 푸앵카레-둘락 정규형은 결함 선형부에 대한 비선형 보정을 다루며, 이는 비선형 진동, 분기 분석, 한계 사이클 안정성 분석에 활용된다.
14.6 행렬 함수의 정확한 계산
기호 계산이 요구되는 로봇 제어 설계에서 행렬 지수 함수, 행렬 로그 함수 등의 정확한 계산이 필요할 때 조르단 표준형이 사용된다. 슈어 분해 기반 계산이 수치적으로 우수하지만, 매개변수에 의존하는 기호적 결과가 필요한 경우 조르단 표준형을 통한 폐형식 표현이 활용된다.
14.7 다중 입력 시스템의 정준 분해
다입출력 시스템의 가제어 부분 공간 분석에서 조르단 표준형은 가제어 모드와 비가제어 모드를 분리하는 정준 분해를 제공한다. 이는 가제어성 회복을 위한 작동기 추가 결정과 강인 제어기 설계에 활용된다.
참고문헌
- Horn, R. A., & Johnson, C. R. (2013). Matrix Analysis (2nd ed.). Cambridge University Press.
- Hoffman, K., & Kunze, R. (1971). Linear Algebra (2nd ed.). Prentice Hall.
- Gantmacher, F. R. (1959). The Theory of Matrices (Vols. 1-2). Chelsea.
- Golub, G. H., & Van Loan, C. F. (2013). Matrix Computations (4th ed.). Johns Hopkins University Press.
- Higham, N. J. (2008). Functions of Matrices: Theory and Computation. SIAM.
- Khalil, H. K. (2002). Nonlinear Systems (3rd ed.). Prentice Hall.
Version: 1.0