29.8 차원 정리(Rank-Nullity Theorem)의 증명과 의미

1. 정리의 진술

차원 정리(Rank-Nullity Theorem)는 유한차원 벡터 공간 사이의 선형 변환이 가지는 가장 기본적인 정량적 결과로, 정의역의 차원이 그 사상의 핵의 차원과 상의 차원의 합과 정확히 일치한다는 사실을 진술한다. 형식적으로는 다음과 같이 기술된다.

1.1 정리 (Rank-Nullity Theorem)

$V$ 와 $W$ 가 동일한 체 $\mathbb{F}$ 위의 벡터 공간이고, $V$ 가 유한차원이며, $T : V \to W$ 가 선형 변환이라면, 다음 등식이 성립한다.

$\dim(V) = \dim(\mathrm{Ker}(T)) + \dim(\mathrm{Im}(T))$

좌변은 정의역의 차원이며, 우변의 첫째 항은 영도(Nullity), 둘째 항은 계수(Rank)이다. 따라서 이 정리는 종종 다음과 같은 형태로 표기된다.

$\dim(V) = \mathrm{nullity}(T) + \mathrm{rank}(T)$

이 결과는 행렬에 대한 진술로 특수화될 수 있다. 행렬 $A \in \mathbb{F}^{m \times n}$ 에 대해서는 다음이 성립한다.

$n = \dim(\mathrm{Null}(A)) + \dim(\mathrm{Col}(A))$

여기서 $n$ 은 $A$ 의 열의 수, 즉 정의역 $\mathbb{F}^{n}$ 의 차원이다.

2. 정리의 형식적 증명

2.1 증명 전략

증명의 핵심은 정의역 $V$ 를 다음과 같이 분해하는 것이다. 먼저 $\mathrm{Ker}(T)$ 의 기저를 잡고, 그 기저를 $V$ 전체의 기저로 확장한다. 그 후 확장에서 추가된 벡터들이 사상되었을 때 형성되는 상의 부분이 $\mathrm{Im}(T)$ 의 기저가 된다는 사실을 보인다. 이로부터 정의역의 기저 벡터의 수가 핵의 기저 벡터의 수와 상의 기저 벡터의 수의 합과 정확히 일치한다는 결론이 따라 나온다.

2.2 단계 1: 핵의 기저와 그 확장

$V$ 가 유한차원이므로 그 부분 공간 $\mathrm{Ker}(T)$ 도 유한차원이다. $\mathrm{Ker}(T)$ 의 기저를

$\{ \mathbf{u}_{1}, \mathbf{u}_{2}, \ldots, \mathbf{u}_{k} \}$

으로 놓는다. 여기서 $k = \dim(\mathrm{Ker}(T))$ 이다. 유한차원 벡터 공간의 부분 공간의 기저는 전체 공간의 기저로 확장될 수 있다는 표준 결과에 의해, 위의 기저에 적절한 벡터들

$\{ \mathbf{v}_{1}, \mathbf{v}_{2}, \ldots, \mathbf{v}_{r} \}$

을 추가하여

$\{ \mathbf{u}_{1}, \mathbf{u}_{2}, \ldots, \mathbf{u}_{k}, \mathbf{v}_{1}, \mathbf{v}_{2}, \ldots, \mathbf{v}_{r} \}$

이 $V$ 의 기저가 되도록 할 수 있다. 따라서 $\dim(V) = k + r$ 이다.

2.3 단계 2: $T(\mathbf{v}_{i})$ 들이 $\mathrm{Im}(T)$ 를 생성한다는 사실

임의의 $\mathbf{w} \in \mathrm{Im}(T)$ 를 택하면, 어떤 $\mathbf{v} \in V$ 가 존재하여 $\mathbf{w} = T(\mathbf{v})$ 이다. $\mathbf{v}$ 를 $V$ 의 기저로 표현하면

$\mathbf{v} = \sum_{i=1}^{k} a_{i} \mathbf{u}_{i} + \sum_{j=1}^{r} b_{j} \mathbf{v}_{j}$

이며, $T$ 의 선형성과 $T(\mathbf{u}_{i}) = \mathbf{0}_{W}$ 의 성질을 적용하면

$\mathbf{w} = T(\mathbf{v}) = \sum_{i=1}^{k} a_{i} T(\mathbf{u}_{i}) + \sum_{j=1}^{r} b_{j} T(\mathbf{v}_{j}) = \sum_{j=1}^{r} b_{j} T(\mathbf{v}_{j})$

가 된다. 따라서 임의의 $\mathbf{w} \in \mathrm{Im}(T)$ 는 집합 $\{ T(\mathbf{v}_{1}), T(\mathbf{v}_{2}), \ldots, T(\mathbf{v}_{r}) \}$ 의 선형결합으로 표현되며, 이 집합은 $\mathrm{Im}(T)$ 를 생성한다.

2.4 단계 3: $T(\mathbf{v}_{i})$ 들이 선형 독립이라는 사실

이제 위 집합이 선형 독립임을 보인다. 선형결합

$\sum_{j=1}^{r} c_{j} T(\mathbf{v}_{j}) = \mathbf{0}_{W}$

가 성립한다고 가정한다. $T$ 의 선형성에 의해 이는

$T\left( \sum_{j=1}^{r} c_{j} \mathbf{v}_{j} \right) = \mathbf{0}_{W}$

와 동등하므로, $\sum_{j=1}^{r} c_{j} \mathbf{v}_{j} \in \mathrm{Ker}(T)$ 가 된다. 따라서 어떤 스칼라 $d_{1}, d_{2}, \ldots, d_{k}$ 가 존재하여

$\sum_{j=1}^{r} c_{j} \mathbf{v}_{j} = \sum_{i=1}^{k} d_{i} \mathbf{u}_{i}$

가 성립한다. 이 식을 이항하면

$\sum_{j=1}^{r} c_{j} \mathbf{v}_{j} - \sum_{i=1}^{k} d_{i} \mathbf{u}_{i} = \mathbf{0}_{V}$

가 되며, 좌변은 $V$ 의 기저 벡터들의 선형결합이다. 그러나 이 기저 벡터들은 정의에 의해 선형 독립이므로, 모든 계수가 0이어야 한다. 즉 $c_{1} = c_{2} = \cdots = c_{r} = 0$ 이고 $d_{1} = d_{2} = \cdots = d_{k} = 0$ 이다. 특히 $c_{j}$ 가 모두 0이라는 사실로부터 $\{ T(\mathbf{v}_{1}), T(\mathbf{v}_{2}), \ldots, T(\mathbf{v}_{r}) \}$ 이 선형 독립임이 따라 나온다.

2.5 단계 4: 차원의 결합

위의 두 단계로부터 $\{ T(\mathbf{v}_{1}), T(\mathbf{v}_{2}), \ldots, T(\mathbf{v}_{r}) \}$ 은 $\mathrm{Im}(T)$ 의 기저이며, 따라서 $\dim(\mathrm{Im}(T)) = r$ 이다. 단계 1로부터 $\dim(V) = k + r$ 이고 $\dim(\mathrm{Ker}(T)) = k$ 이므로 다음이 성립한다.

$\dim(V) = k + r = \dim(\mathrm{Ker}(T)) + \dim(\mathrm{Im}(T))$

이로써 차원 정리가 증명된다.

3. 정리의 의미와 해석

차원 정리는 단순히 두 차원의 합이 정의역의 차원이 된다는 산술적 등식이 아니라, 선형 변환의 작용을 두 가지 상보적 과정으로 분해하는 정량적 결과이다. 한쪽에서 핵은 사상이 영점으로 보내는 방향, 즉 정보가 손실되는 방향의 집합이며, 다른 쪽에서 상은 사상이 도달할 수 있는 방향의 집합이다. 정의역의 모든 차원은 이 두 가지 가운데 정확히 한쪽에 기여한다. 즉, 정의역의 한 차원은 사상에 의해 짜그러져 영점으로 사라지든지, 그렇지 않으면 상의 한 차원으로 보존된다.

이러한 해석은 차원 정리를 종종 “정보 보존 정리“의 한 형태로 부르게 만드는 직관의 근거이다. 정의역의 정보는 사상에 의해 부분적으로 손실될 수 있지만, 손실된 차원과 보존된 차원의 합은 항상 정의역의 전체 차원과 일치한다.

4. 즉각적 따름정리

4.1 단사 사상의 차원 조건

$T : V \to W$ 가 단사이면 $\mathrm{Ker}(T) = \{ \mathbf{0}_{V} \}$ 이므로 $\dim(\mathrm{Ker}(T)) = 0$ 이고, 따라서 $\dim(V) = \dim(\mathrm{Im}(T))$ 가 성립한다. 이로부터 $\dim(V) \le \dim(W)$ 가 따라 나오며, 정의역의 차원이 공역의 차원보다 큰 경우에는 단사 사상이 결코 존재할 수 없다는 결론이 얻어진다.

4.2 전사 사상의 차원 조건

$T$ 가 전사이면 $\mathrm{Im}(T) = W$ 이므로 $\dim(\mathrm{Im}(T)) = \dim(W)$ 이고, 차원 정리로부터 $\dim(V) = \dim(\mathrm{Ker}(T)) + \dim(W)$ 가 성립하므로 $\dim(V) \ge \dim(W)$ 가 따라 나온다. 즉 정의역의 차원이 공역의 차원보다 작은 경우에는 전사 사상이 결코 존재할 수 없다.

4.3 동형 사상의 차원 조건

위 두 따름정리를 결합하면, $T$ 가 동형 사상(Isomorphism)이기 위한 필요조건은 $\dim(V) = \dim(W)$ 이다. 또한 정의역과 공역의 차원이 동일한 경우에는, $T$ 가 단사일 필요충분조건이 곧 전사일 필요충분조건과 동치가 되어, 둘 가운데 한쪽만 확인하면 자동으로 다른 쪽이 따라온다. 이 결과는 유한차원 선형대수의 가장 단순하면서도 강력한 결과 가운데 하나이며, 일반적인 함수 이론에서는 결코 성립하지 않는 특수한 성질이다.

4.4 정사각 행렬의 가역성

특히 정사각 행렬 $A \in \mathbb{F}^{n \times n}$ 에 대해서는 다음의 조건들이 모두 동치이다.

(i) $A$ 는 가역이다.
(ii) $A$ 의 영 공간은 자명하다, 즉 $\mathrm{Null}(A) = \{ \mathbf{0} \}$ 이다.
(iii) $A$ 의 열공간이 $\mathbb{F}^{n}$ 전체이다.
(iv) $A$ 의 계수가 $n$ 이다.
(v) $A \mathbf{x} = \mathbf{0}$ 의 유일한 해는 $\mathbf{x} = \mathbf{0}$ 이다.
(vi) $A \mathbf{x} = \mathbf{b}$ 가 임의의 $\mathbf{b}$ 에 대해 유일한 해를 가진다.

이러한 동치 조건들은 통상 가역 행렬 정리(Invertible Matrix Theorem)로 알려져 있으며, 차원 정리가 그 핵심적인 토대를 제공한다.

5. 응용

5.1 선형 시스템의 해 구조

비동차 선형 방정식 $A \mathbf{x} = \mathbf{b}$ 가 해를 가질 때, 그 해의 자유도는 정확히 $\dim(\mathrm{Null}(A)) = n - \mathrm{rank}(A)$ 와 같다. 즉, 해의 수가 유일한지, 무한히 많은지, 그 자유도가 얼마인지를 차원 정리는 정확하게 정량화한다.

5.2 최소 제곱법

행렬 $A \in \mathbb{R}^{m \times n}$ 에 대해 정상 방정식 $A^{\top} A \mathbf{x} = A^{\top} \mathbf{b}$ 의 유일한 해가 존재하기 위한 필요충분조건은 $A^{\top} A$ 가 가역인 것이며, 이는 $A$ 의 열들이 선형 독립인 것, 즉 $\mathrm{rank}(A) = n$ 인 것과 동치이다. 이러한 조건은 차원 정리에 의해 자연스럽게 드러난다.

5.3 신경망의 표현력 분석

가중치 행렬 $W \in \mathbb{R}^{m \times n}$ 의 계수 $r$ 은 그 계층이 사상할 수 있는 출력 부분 공간의 차원과 같으며, 영도 $n - r$ 은 그 계층이 무시하는 입력 방향의 차원과 같다. 가중치를 저랭크로 분해하는 LoRA와 같은 기법은 본질적으로 큰 영도를 가지는 보조 행렬을 학습함으로써, 매개변수 효율성과 표현력 사이의 절충을 차원 정리에 의해 정확히 정량화하는 절차로 해석된다.

6. 결론

차원 정리는 선형 변환의 두 핵심 부분 공간—핵과 상—의 차원이 정의역의 차원에 의해 엄격히 통제된다는 사실을 진술한다. 정의역의 한 차원은 사상에 의해 짜그러지거나 보존되며, 이 두 가능성의 합이 정의역의 전체 차원을 이룬다. 이러한 관계는 단순한 산술적 등식 이상의 구조적 의미를 가지며, 단사성과 전사성, 정사각 행렬의 가역성, 선형 시스템의 해 구조, 최소 제곱법, 그리고 신경망 가중치의 표현력에 이르기까지 선형대수와 그 응용 전반의 기초적 토대를 형성한다.