29.8 차원 정리(Rank-Nullity Theorem)의 증명과 의미

1. 정리의 진술

차원 정리(Rank-Nullity Theorem)는 유한차원 벡터 공간 사이의 선형 변환이 가지는 가장 기본적인 정량적 결과로, 정의역의 차원이 그 사상의 핵의 차원과 상의 차원의 합과 정확히 일치한다는 사실을 진술한다. 형식적으로는 다음과 같이 기술된다.

1.1 정리 (Rank-Nullity Theorem)

VW가 동일한 체 \mathbb{F} 위의 벡터 공간이고, V가 유한차원이며, T : V \to W가 선형 변환이라면, 다음 등식이 성립한다.

\dim(V) = \dim(\mathrm{Ker}(T)) + \dim(\mathrm{Im}(T))

좌변은 정의역의 차원이며, 우변의 첫째 항은 영도(Nullity), 둘째 항은 계수(Rank)이다. 따라서 이 정리는 종종 다음과 같은 형태로 표기된다.

\dim(V) = \mathrm{nullity}(T) + \mathrm{rank}(T)

이 결과는 행렬에 대한 진술로 특수화될 수 있다. 행렬 A \in \mathbb{F}^{m \times n}에 대해서는 다음이 성립한다.

n = \dim(\mathrm{Null}(A)) + \dim(\mathrm{Col}(A))

여기서 nA의 열의 수, 즉 정의역 \mathbb{F}^{n}의 차원이다.

2. 정리의 형식적 증명

2.1 증명 전략

증명의 핵심은 정의역 V를 다음과 같이 분해하는 것이다. 먼저 \mathrm{Ker}(T)의 기저를 잡고, 그 기저를 V 전체의 기저로 확장한다. 그 후 확장에서 추가된 벡터들이 사상되었을 때 형성되는 상의 부분이 \mathrm{Im}(T)의 기저가 된다는 사실을 보인다. 이로부터 정의역의 기저 벡터의 수가 핵의 기저 벡터의 수와 상의 기저 벡터의 수의 합과 정확히 일치한다는 결론이 따라 나온다.

2.2 단계 1: 핵의 기저와 그 확장

V가 유한차원이므로 그 부분 공간 \mathrm{Ker}(T)도 유한차원이다. \mathrm{Ker}(T)의 기저를

\{ \mathbf{u}_{1}, \mathbf{u}_{2}, \ldots, \mathbf{u}_{k} \}

으로 놓는다. 여기서 k = \dim(\mathrm{Ker}(T))이다. 유한차원 벡터 공간의 부분 공간의 기저는 전체 공간의 기저로 확장될 수 있다는 표준 결과에 의해, 위의 기저에 적절한 벡터들

\{ \mathbf{v}_{1}, \mathbf{v}_{2}, \ldots, \mathbf{v}_{r} \}

을 추가하여

\{ \mathbf{u}_{1}, \mathbf{u}_{2}, \ldots, \mathbf{u}_{k}, \mathbf{v}_{1}, \mathbf{v}_{2}, \ldots, \mathbf{v}_{r} \}

V의 기저가 되도록 할 수 있다. 따라서 \dim(V) = k + r이다.

2.3 단계 2: T(\mathbf{v}_{i})들이 \mathrm{Im}(T)를 생성한다는 사실

임의의 \mathbf{w} \in \mathrm{Im}(T)를 택하면, 어떤 \mathbf{v} \in V가 존재하여 \mathbf{w} = T(\mathbf{v})이다. \mathbf{v}V의 기저로 표현하면

\mathbf{v} = \sum_{i=1}^{k} a_{i} \mathbf{u}_{i} + \sum_{j=1}^{r} b_{j} \mathbf{v}_{j}

이며, T의 선형성과 T(\mathbf{u}_{i}) = \mathbf{0}_{W}의 성질을 적용하면

\mathbf{w} = T(\mathbf{v}) = \sum_{i=1}^{k} a_{i} T(\mathbf{u}_{i}) + \sum_{j=1}^{r} b_{j} T(\mathbf{v}_{j}) = \sum_{j=1}^{r} b_{j} T(\mathbf{v}_{j})

가 된다. 따라서 임의의 \mathbf{w} \in \mathrm{Im}(T)는 집합 \{ T(\mathbf{v}_{1}), T(\mathbf{v}_{2}), \ldots, T(\mathbf{v}_{r}) \}의 선형결합으로 표현되며, 이 집합은 \mathrm{Im}(T)를 생성한다.

2.4 단계 3: T(\mathbf{v}_{i})들이 선형 독립이라는 사실

이제 위 집합이 선형 독립임을 보인다. 선형결합

\sum_{j=1}^{r} c_{j} T(\mathbf{v}_{j}) = \mathbf{0}_{W}

가 성립한다고 가정한다. T의 선형성에 의해 이는

T\left( \sum_{j=1}^{r} c_{j} \mathbf{v}_{j} \right) = \mathbf{0}_{W}

와 동등하므로, \sum_{j=1}^{r} c_{j} \mathbf{v}_{j} \in \mathrm{Ker}(T)가 된다. 따라서 어떤 스칼라 d_{1}, d_{2}, \ldots, d_{k}가 존재하여

\sum_{j=1}^{r} c_{j} \mathbf{v}_{j} = \sum_{i=1}^{k} d_{i} \mathbf{u}_{i}

가 성립한다. 이 식을 이항하면

\sum_{j=1}^{r} c_{j} \mathbf{v}_{j} - \sum_{i=1}^{k} d_{i} \mathbf{u}_{i} = \mathbf{0}_{V}

가 되며, 좌변은 V의 기저 벡터들의 선형결합이다. 그러나 이 기저 벡터들은 정의에 의해 선형 독립이므로, 모든 계수가 0이어야 한다. 즉 c_{1} = c_{2} = \cdots = c_{r} = 0이고 d_{1} = d_{2} = \cdots = d_{k} = 0이다. 특히 c_{j}가 모두 0이라는 사실로부터 \{ T(\mathbf{v}_{1}), T(\mathbf{v}_{2}), \ldots, T(\mathbf{v}_{r}) \}이 선형 독립임이 따라 나온다.

2.5 단계 4: 차원의 결합

위의 두 단계로부터 \{ T(\mathbf{v}_{1}), T(\mathbf{v}_{2}), \ldots, T(\mathbf{v}_{r}) \}\mathrm{Im}(T)의 기저이며, 따라서 \dim(\mathrm{Im}(T)) = r이다. 단계 1로부터 \dim(V) = k + r이고 \dim(\mathrm{Ker}(T)) = k이므로 다음이 성립한다.

\dim(V) = k + r = \dim(\mathrm{Ker}(T)) + \dim(\mathrm{Im}(T))

이로써 차원 정리가 증명된다.

3. 정리의 의미와 해석

차원 정리는 단순히 두 차원의 합이 정의역의 차원이 된다는 산술적 등식이 아니라, 선형 변환의 작용을 두 가지 상보적 과정으로 분해하는 정량적 결과이다. 한쪽에서 핵은 사상이 영점으로 보내는 방향, 즉 정보가 손실되는 방향의 집합이며, 다른 쪽에서 상은 사상이 도달할 수 있는 방향의 집합이다. 정의역의 모든 차원은 이 두 가지 가운데 정확히 한쪽에 기여한다. 즉, 정의역의 한 차원은 사상에 의해 짜그러져 영점으로 사라지든지, 그렇지 않으면 상의 한 차원으로 보존된다.

이러한 해석은 차원 정리를 종종 “정보 보존 정리“의 한 형태로 부르게 만드는 직관의 근거이다. 정의역의 정보는 사상에 의해 부분적으로 손실될 수 있지만, 손실된 차원과 보존된 차원의 합은 항상 정의역의 전체 차원과 일치한다.

4. 즉각적 따름정리

4.1 단사 사상의 차원 조건

T : V \to W가 단사이면 \mathrm{Ker}(T) = \{ \mathbf{0}_{V} \}이므로 \dim(\mathrm{Ker}(T)) = 0이고, 따라서 \dim(V) = \dim(\mathrm{Im}(T))가 성립한다. 이로부터 \dim(V) \le \dim(W)가 따라 나오며, 정의역의 차원이 공역의 차원보다 큰 경우에는 단사 사상이 결코 존재할 수 없다는 결론이 얻어진다.

4.2 전사 사상의 차원 조건

T가 전사이면 \mathrm{Im}(T) = W이므로 \dim(\mathrm{Im}(T)) = \dim(W)이고, 차원 정리로부터 \dim(V) = \dim(\mathrm{Ker}(T)) + \dim(W)가 성립하므로 \dim(V) \ge \dim(W)가 따라 나온다. 즉 정의역의 차원이 공역의 차원보다 작은 경우에는 전사 사상이 결코 존재할 수 없다.

4.3 동형 사상의 차원 조건

위 두 따름정리를 결합하면, T가 동형 사상(Isomorphism)이기 위한 필요조건은 \dim(V) = \dim(W)이다. 또한 정의역과 공역의 차원이 동일한 경우에는, T가 단사일 필요충분조건이 곧 전사일 필요충분조건과 동치가 되어, 둘 가운데 한쪽만 확인하면 자동으로 다른 쪽이 따라온다. 이 결과는 유한차원 선형대수의 가장 단순하면서도 강력한 결과 가운데 하나이며, 일반적인 함수 이론에서는 결코 성립하지 않는 특수한 성질이다.

4.4 정사각 행렬의 가역성

특히 정사각 행렬 A \in \mathbb{F}^{n \times n}에 대해서는 다음의 조건들이 모두 동치이다.

(i) A는 가역이다.
(ii) A의 영 공간은 자명하다, 즉 \mathrm{Null}(A) = \{ \mathbf{0} \}이다.
(iii) A의 열공간이 \mathbb{F}^{n} 전체이다.
(iv) A의 계수가 n이다.
(v) A \mathbf{x} = \mathbf{0}의 유일한 해는 \mathbf{x} = \mathbf{0}이다.
(vi) A \mathbf{x} = \mathbf{b}가 임의의 \mathbf{b}에 대해 유일한 해를 가진다.

이러한 동치 조건들은 통상 가역 행렬 정리(Invertible Matrix Theorem)로 알려져 있으며, 차원 정리가 그 핵심적인 토대를 제공한다.

5. 응용

5.1 선형 시스템의 해 구조

비동차 선형 방정식 A \mathbf{x} = \mathbf{b}가 해를 가질 때, 그 해의 자유도는 정확히 \dim(\mathrm{Null}(A)) = n - \mathrm{rank}(A)와 같다. 즉, 해의 수가 유일한지, 무한히 많은지, 그 자유도가 얼마인지를 차원 정리는 정확하게 정량화한다.

5.2 최소 제곱법

행렬 A \in \mathbb{R}^{m \times n}에 대해 정상 방정식 A^{\top} A \mathbf{x} = A^{\top} \mathbf{b}의 유일한 해가 존재하기 위한 필요충분조건은 A^{\top} A가 가역인 것이며, 이는 A의 열들이 선형 독립인 것, 즉 \mathrm{rank}(A) = n인 것과 동치이다. 이러한 조건은 차원 정리에 의해 자연스럽게 드러난다.

5.3 신경망의 표현력 분석

가중치 행렬 W \in \mathbb{R}^{m \times n}의 계수 r은 그 계층이 사상할 수 있는 출력 부분 공간의 차원과 같으며, 영도 n - r은 그 계층이 무시하는 입력 방향의 차원과 같다. 가중치를 저랭크로 분해하는 LoRA와 같은 기법은 본질적으로 큰 영도를 가지는 보조 행렬을 학습함으로써, 매개변수 효율성과 표현력 사이의 절충을 차원 정리에 의해 정확히 정량화하는 절차로 해석된다.

6. 결론

차원 정리는 선형 변환의 두 핵심 부분 공간—핵과 상—의 차원이 정의역의 차원에 의해 엄격히 통제된다는 사실을 진술한다. 정의역의 한 차원은 사상에 의해 짜그러지거나 보존되며, 이 두 가능성의 합이 정의역의 전체 차원을 이룬다. 이러한 관계는 단순한 산술적 등식 이상의 구조적 의미를 가지며, 단사성과 전사성, 정사각 행렬의 가역성, 선형 시스템의 해 구조, 최소 제곱법, 그리고 신경망 가중치의 표현력에 이르기까지 선형대수와 그 응용 전반의 기초적 토대를 형성한다.