선형 변환과 행렬 표현
선형 대수에서 행렬의 고유값과 고유벡터는 선형 변환을 이해하는 핵심 개념 중 하나이다. 선형 변환은 벡터를 다른 벡터로 매핑하는 함수이다. 행렬 \mathbf{A}는 이러한 선형 변환을 표현하는 도구로, n차원 벡터 \mathbf{x}에 대해 다음과 같은 선형 변환을 정의한다.
여기서 \mathbf{x}는 원래의 벡터, \mathbf{y}는 변환된 벡터이다. 고유값과 고유벡터는 이 선형 변환에서 벡터가 일정한 스칼라 배율로만 변하고, 방향은 바뀌지 않는 경우를 분석하는 도구이다.
고유값 문제
행렬 \mathbf{A}에 대해 고유값 \lambda와 고유벡터 \mathbf{v}는 다음 조건을 만족한다.
여기서 \lambda는 스칼라 값으로, 이 방정식의 해를 고유값이라고 하며, \mathbf{v}는 0이 아닌 벡터로 이 해를 만족하는 고유벡터이다. 이 방정식은 행렬 \mathbf{A}가 고유벡터 \mathbf{v}의 방향을 바꾸지 않고 스칼라 배만큼 변환함을 의미한다.
특성 방정식의 유도
고유값을 찾기 위해 먼저 방정식을 다음과 같이 변형할 수 있다.
위의 방정식은 다음과 같이 행렬 형태로 재구성된다.
여기서 \mathbf{I}는 단위 행렬이다. 이 방정식이 0이 아닌 해 \mathbf{v}를 가지기 위해서는 행렬 \mathbf{A} - \lambda \mathbf{I}의 행렬식이 0이어야 한다. 즉,
이 방정식을 특성 방정식이라고 한다. 이 방정식을 풀면 고유값 \lambda를 구할 수 있다.
특성 다항식의 풀이
특성 방정식 \text{det}(\mathbf{A} - \lambda \mathbf{I}) = 0은 보통 다항식 형태를 띠며, 이 다항식을 특성 다항식이라고 한다. 이 다항식의 차수는 행렬 \mathbf{A}의 크기 n \times n에 따라 결정된다. 특성 다항식을 풀어 고유값 \lambda를 구하는 과정은 다음과 같다.
- 특성 행렬 구성: 주어진 행렬 \mathbf{A}에 대해 \mathbf{A} - \lambda \mathbf{I}를 계산한다.
- 행렬식 계산: \mathbf{A} - \lambda \mathbf{I}의 행렬식을 구한다. 이 행렬식은 \lambda에 대한 다항식으로 표현된다.
- 다항식 풀이: \text{det}(\mathbf{A} - \lambda \mathbf{I}) = 0을 만족하는 \lambda를 계산한다. 이는 일반적으로 다항 방정식을 푸는 과정과 유사하며, n차 방정식을 풀어 n개의 고유값을 찾을 수 있다.
고유벡터의 계산
고유값을 구한 후, 각 고유값에 대응하는 고유벡터를 구하는 방법은 다음과 같다.
- 고유값 대입: 구한 고유값 \lambda를 방정식 (\mathbf{A} - \lambda \mathbf{I}) \mathbf{v} = \mathbf{0}에 대입한다.
- 선형 방정식 풀기: 위의 선형 방정식을 풀어 고유벡터 \mathbf{v}를 구한다. 이는 연립 방정식의 해를 구하는 것과 유사한다.
- 벡터의 스케일링: 고유벡터는 크기만큼은 자유롭기 때문에, 일반적으로 단위 벡터로 정규화하여 표현한다.
복소수 고유값과 고유벡터
만약 특성 다항식의 해가 실수가 아닌 복소수라면, 고유값과 고유벡터는 복소수 형태로 존재할 수 있다. 이 경우에도 계산 절차는 동일하며, 복소수 연산을 통해 고유값과 고유벡터를 구한다.
실수 고유값과 복소수 고유값의 구분
고유값 문제에서 실수 고유값과 복소수 고유값은 구분되어 다뤄진다. 행렬이 실수 행렬일 때, 특성 다항식의 해는 실수일 수도 있고, 복소수일 수도 있다. 이때 고유값이 실수인 경우 그에 대응하는 고유벡터는 실수 벡터이고, 고유값이 복소수인 경우 그에 대응하는 고유벡터도 복소수 벡터이다.
복소수 고유값은 일반적으로 짝수로 나타난다. 예를 들어, \lambda = a + bi가 고유값이라면, \lambda = a - bi도 고유값이다. 이 두 고유값에 대응하는 고유벡터들은 서로 복소수 켤레 관계에 있다.
대칭 행렬의 고유값과 고유벡터
대칭 행렬(즉, \mathbf{A}^T = \mathbf{A})은 중요한 성질을 가지고 있다. 이 경우 모든 고유값은 실수이며, 서로 다른 고유값에 대응하는 고유벡터들은 서로 직교한다. 이 성질은 고유값 문제를 보다 간단하게 만든다.
대칭 행렬의 고유값을 구할 때는 실수로만 구성된 특성 다항식을 풀어야 하며, 그 결과로 얻어진 고유벡터들은 직교화 과정이 필요 없다. 이와 같은 특성은 대각화와 밀접한 관련이 있다.
수치적 방법을 통한 고유값과 고유벡터의 계산
대부분의 경우, 특히 큰 행렬에 대해서는 특성 다항식을 풀이하는 것이 비실용적일 수 있다. 따라서 수치적 방법이 고유값 문제를 해결하는 데 널리 사용된다. 대표적인 수치적 방법으로는 멱급수 방법(Power Iteration Method), QR 알고리즘 등이 있다.
-
멱급수 방법(Power Iteration Method): 가장 큰 절댓값을 갖는 고유값과 그에 대응하는 고유벡터를 찾는 데 사용된다. 이 방법은 임의의 초기 벡터를 반복적으로 행렬에 곱하여 점진적으로 고유벡터에 수렴하게 한다.
-
QR 알고리즘: 모든 고유값을 동시에 계산할 수 있는 강력한 방법으로, 행렬을 QR 분해하여 반복적으로 변형함으로써 행렬을 삼각화하고, 이를 통해 고유값을 구한다.
이 수치적 방법들은 직접적인 풀이보다 더 빠르고 안정적으로 고유값과 고유벡터를 찾을 수 있으며, 특히 대형 행렬의 경우에 매우 유용하다.
고유값의 배수성과 고유벡터
특정 고유값이 여러 번 나타나는 경우, 이를 고유값의 대수적 중복도라고 한다. 예를 들어, \lambda가 k번 나타난다면, 그 대수적 중복도는 k이다. 이에 대응하는 고유벡터는 하나일 수도 있고 여러 개일 수도 있으며, 이 경우 고유공간을 정의하게 된다.
고유공간은 해당 고유값에 대한 고유벡터들의 선형 결합으로 구성된 부분 공간으로, 고유값의 대수적 중복도가 k인 경우 최대 k차원까지 확장될 수 있다. 이때 고유값의 기하적 중복도는 해당 고유공간의 차원으로 정의되며, 대수적 중복도보다 작거나 같을 수 있다.
이러한 고유값의 중복도와 고유공간의 개념은 행렬의 대각화 가능성과 조르당 표준형을 이해하는 데 중요한 역할을 한다.