29.6 선형 변환의 핵(Kernel)과 영 공간(Null Space)의 정의

29.6 선형 변환의 핵(Kernel)과 영 공간(Null Space)의 정의

1. 정의

벡터 공간 VW 사이에서 정의된 선형 변환 T : V \to W에 대하여, 정의역의 원소 가운데 그 사상의 결과가 공역의 영벡터가 되는 모든 벡터들의 집합을 선형 변환 T의 핵(Kernel) 또는 영 공간(Null Space)이라 부르며, 일반적으로 다음과 같이 표기한다.

\mathrm{Ker}(T) = \{ \mathbf{v} \in V : T(\mathbf{v}) = \mathbf{0}_{W} \}

행렬 A \in \mathbb{F}^{m \times n}에 의해 정의되는 선형 변환 T(\mathbf{v}) = A \mathbf{v}의 경우, 동일한 집합을 행렬 A의 영 공간이라 부르며 다음과 같이 정의된다.

\mathrm{Null}(A) = \{ \mathbf{v} \in \mathbb{F}^{n} : A \mathbf{v} = \mathbf{0} \}

따라서 핵과 영 공간이라는 두 용어는 추상적 선형 변환에 대해서는 핵, 그 행렬 표현에 대해서는 영 공간이라는 미세한 표기상의 구별을 가지지만, 본질적으로 동일한 대상을 가리킨다. 이들 모두는 동차 선형 방정식 A \mathbf{v} = \mathbf{0}의 해 집합과 일치한다.

2. 핵이 부분 공간을 이룬다는 사실

\mathrm{Ker}(T)는 단순한 집합이 아니라 정의역 V의 부분 공간이며, 이는 직접적인 검증으로 증명된다.

2.1 영벡터의 포함

T가 선형 변환이므로, 동차성에 의해 T(\mathbf{0}_{V}) = \mathbf{0}_{W}가 성립하며 따라서 \mathbf{0}_{V} \in \mathrm{Ker}(T)이다. 즉 핵은 공집합이 아니다.

2.2 덧셈에 대한 닫힘

임의의 두 벡터 \mathbf{u}, \mathbf{v} \in \mathrm{Ker}(T)에 대하여, 가법성에 의해 T(\mathbf{u} + \mathbf{v}) = T(\mathbf{u}) + T(\mathbf{v}) = \mathbf{0}_{W} + \mathbf{0}_{W} = \mathbf{0}_{W}이므로 \mathbf{u} + \mathbf{v} \in \mathrm{Ker}(T)이다.

2.3 스칼라 곱에 대한 닫힘

임의의 \mathbf{v} \in \mathrm{Ker}(T)와 임의의 스칼라 c \in \mathbb{F}에 대하여, 동차성에 의해 T(c \mathbf{v}) = c T(\mathbf{v}) = c \mathbf{0}_{W} = \mathbf{0}_{W}이므로 c \mathbf{v} \in \mathrm{Ker}(T)이다.

위 세 조건이 모두 성립하므로 \mathrm{Ker}(T)는 정의역의 부분 공간이다. 이러한 사실은 핵이 단지 임의의 점들의 모임이 아니라, 정의역에 자연스럽게 새겨지는 선형 구조라는 점을 의미한다.

3. 단사성과 핵의 관계

선형 변환 T : V \to W가 단사(Injective)일 필요충분조건은 그 핵이 자명한 부분 공간, 즉 \mathrm{Ker}(T) = \{ \mathbf{0}_{V} \}인 것이다.

3.1 증명

먼저 T가 단사라고 가정한다. 임의의 \mathbf{v} \in \mathrm{Ker}(T)에 대해 T(\mathbf{v}) = \mathbf{0}_{W} = T(\mathbf{0}_{V})이며, 단사성에 의해 \mathbf{v} = \mathbf{0}_{V}가 된다. 따라서 \mathrm{Ker}(T) = \{ \mathbf{0}_{V} \}이다.

역으로 \mathrm{Ker}(T) = \{ \mathbf{0}_{V} \}라고 가정한다. 임의의 \mathbf{u}, \mathbf{v} \in V에 대해 T(\mathbf{u}) = T(\mathbf{v})이면, 가법성과 음원의 보존에 의해 T(\mathbf{u} - \mathbf{v}) = T(\mathbf{u}) - T(\mathbf{v}) = \mathbf{0}_{W}이므로 \mathbf{u} - \mathbf{v} \in \mathrm{Ker}(T) = \{ \mathbf{0}_{V} \}, 즉 \mathbf{u} = \mathbf{v}이다. 따라서 T는 단사이다.

이러한 동치성은 일반적인 함수의 단사성을 직접 검사하는 것보다, 핵의 자명성만을 확인하는 것으로 단사성을 판별할 수 있게 해 주는 매우 유용한 도구이다.

4. 동차 선형 방정식의 해 공간으로서의 영 공간

행렬 A \in \mathbb{F}^{m \times n}의 영 공간은 동차 선형 방정식 A \mathbf{v} = \mathbf{0}의 모든 해의 집합과 일치한다. 따라서 영 공간은 단순한 추상 개념이 아니라, 선형 방정식의 해 구조를 직접적으로 표현하는 구체적 대상이다. 비동차 방정식 A \mathbf{v} = \mathbf{b}의 해 집합은, 만약 어떤 특수해 \mathbf{v}_{0}가 존재한다면, \mathbf{v}_{0} + \mathrm{Null}(A) 형태의 아핀 부분 공간으로 표현된다. 이는 해 집합의 구조를 다음과 같이 분해하는 표준적 결과를 함의한다.

\{ \mathbf{v} \in \mathbb{F}^{n} : A \mathbf{v} = \mathbf{b} \} = \mathbf{v}_{0} + \mathrm{Null}(A)

이러한 분해는 선형 시스템의 해법, 회귀 분석, 제약 조건이 부여된 최적화 문제 등에서 핵심적 역할을 수행한다.

5. 영 공간의 차원과 영도

영 공간의 차원을 영도(Nullity)라 부르며, 일반적으로 \mathrm{nullity}(T) = \dim(\mathrm{Ker}(T))로 표기한다. 영도는 선형 변환이 정의역에서 얼마나 많은 정보를 잃는지에 대한 정량적 척도이다. 영도가 0이면 사상은 단사이며 어떠한 정보도 잃지 않는 반면, 영도가 1이면 한 차원의 정보가 손실되고, 일반적으로 영도가 k이면 k차원의 정보가 손실된다. 후속 절에서 다루게 될 차원 정리(Rank-Nullity Theorem)는 이러한 정보 손실을 정의역의 차원과 상의 차원을 통해 정확하게 정량화한다.

6. 영 공간의 계산 절차

행렬 A의 영 공간을 구하는 표준 절차는 다음과 같다. 첫째, A를 행 사다리꼴(Row Echelon Form) 또는 환원 행 사다리꼴(Reduced Row Echelon Form)로 변환하는 가우스 소거법을 적용한다. 둘째, 환원된 행 사다리꼴에서 기본 변수(Pivot Variable)와 자유 변수(Free Variable)를 구분한다. 셋째, 각 자유 변수를 매개변수로 두고, 기본 변수들을 자유 변수의 일차 결합으로 표현한다. 넷째, 자유 변수 한 개씩에만 1을 대입하고 나머지에 0을 대입하여 얻은 벡터들의 집합이 영 공간의 기저를 이룬다.

이 절차를 통해 영 공간의 기저와 그 차원을 동시에 결정할 수 있으며, 자유 변수의 개수가 영도와 정확히 일치한다.

7. 기하학적 해석

핵의 기하학적 의미는 매우 명료하다. T가 정의역 V를 공역 W로 사상하는 선형 변환이라고 할 때, 핵은 정의역의 어떤 부분 공간 위의 모든 벡터가 동일한 점, 즉 공역의 영벡터로 짜그러져 사상되는 영역에 해당한다. 이 의미에서 핵은 사상의 “퇴화 방향“을 표현한다. 영도가 클수록 사상은 더 많은 차원을 짜그러뜨리며, 그 결과 상의 차원은 그만큼 작아진다.

평면에서 한 직선 위로 점을 직교 사영하는 사영 변환을 예로 들면, 그 변환의 핵은 사영 직선에 수직인 방향으로 펼쳐지는 또 다른 직선이며, 이 수직 직선 위의 모든 점이 원점으로 짜그러져 사상된다. 마찬가지로 평면을 한 점으로 보내는 영 사상(Zero Map)의 핵은 평면 전체가 되며, 영 사상은 정의역의 모든 정보를 한 점으로 짜그러뜨리는 극단적인 사례에 해당한다.

8. 신경망 가중치 행렬의 영 공간

딥러닝의 맥락에서 가중치 행렬 W \in \mathbb{R}^{m \times n}의 영 공간은 그 계층이 식별하지 못하는 입력 방향의 집합을 나타낸다. 입력 공간의 어떤 벡터 \mathbf{v}W의 영 공간에 속한다면, 그 벡터는 가중치 곱셈에 의해 영벡터로 사상되며, 그 결과 후속 활성 함수와 모든 후속 계층에서도 0의 영향을 미친다. 즉, 영 공간의 방향은 그 계층을 통해 전혀 전달되지 않는 정보 방향이다. 이러한 관찰은 가중치 행렬의 표현력을 평가할 때 핵심적이며, 가중치가 저랭크일수록 영 공간의 차원이 커지고, 따라서 더 많은 입력 방향이 무시된다는 사실을 의미한다.

이와 관련된 실용적 사례는 임베딩 행렬과 같이 입력 차원이 출력 차원보다 큰 경우에 자주 등장한다. 또한 가중치의 저랭크 구조를 명시적으로 활용하는 LoRA(Low-Rank Adaptation)와 같은 기법은, 본질적으로 큰 영 공간을 가진 보조 행렬을 학습함으로써 매개변수 수를 줄이는 접근으로 해석할 수 있다.

9. 결론

선형 변환의 핵, 또는 행렬의 영 공간은 사상이 정의역에서 어떤 방향들을 영점으로 보내는지를 나타내는 부분 공간으로, 멱등성, 단사성, 동차 선형 방정식의 해 구조 등 여러 본질적 개념과 직접 연결된다. 핵이 자명한 부분 공간일 때 사상은 단사이며, 핵의 차원이 큰 사상일수록 더 많은 정보가 손실된다. 핵의 정의는 단순하지만, 그 결과는 차원 정리, 행렬의 계수 분석, 최소 제곱법, 선형 시스템의 해 구조, 그리고 신경망 가중치의 표현력 분석에 이르기까지 선형대수학과 그 응용에서 가장 자주 사용되는 도구 가운데 하나가 된다.