29.9 단사(Injective), 전사(Surjective), 전단사(Bijective) 선형 변환의 판별

29.9 단사(Injective), 전사(Surjective), 전단사(Bijective) 선형 변환의 판별

1. 일반적 함수 이론에서의 정의

함수 f : X \to Y가 정의된 임의의 집합 사이의 사상이라고 할 때, 단사·전사·전단사의 개념은 다음과 같이 정의된다. 첫째, 단사(Injective) 또는 일대일(One-to-One) 사상이라 함은 서로 다른 입력이 서로 다른 출력으로 사상되는 것을 의미한다. 즉 f(x_{1}) = f(x_{2})이면 x_{1} = x_{2}이다. 둘째, 전사(Surjective) 또는 위로(Onto) 사상이라 함은 공역의 모든 원소가 어떤 입력의 상으로 나타나는 것을 의미한다. 즉 임의의 y \in Y에 대하여 f(x) = yx \in X가 존재한다. 셋째, 전단사(Bijective)는 단사이면서 동시에 전사인 사상을 의미한다.

이 정의는 임의의 함수에 대해 그대로 적용되지만, 사상이 선형 변환인 경우에는 이 세 가지 성질이 모두 영 공간과 상이라는 두 부분 공간의 차원적 조건으로 환원되며, 일반적인 함수의 경우보다 훨씬 단순하고 효율적인 판별법이 가능해진다. 이 절에서는 선형 변환에 대한 판별 조건을 체계적으로 정리한다.

2. 단사 선형 변환의 판별

2.1 영 공간 조건

선형 변환 T : V \to W가 단사일 필요충분조건은 그 핵이 자명한 부분 공간인 것, 즉

\mathrm{Ker}(T) = \{ \mathbf{0}_{V} \}

이다.

2.2 동치성의 증명

먼저 T가 단사라고 가정하자. 임의의 \mathbf{v} \in \mathrm{Ker}(T)에 대하여 T(\mathbf{v}) = \mathbf{0}_{W} = T(\mathbf{0}_{V})이며, T의 단사성에 의해 \mathbf{v} = \mathbf{0}_{V}이다. 따라서 \mathrm{Ker}(T) = \{ \mathbf{0}_{V} \}이다.

역으로 \mathrm{Ker}(T) = \{ \mathbf{0}_{V} \}라고 가정하자. 임의의 \mathbf{u}, \mathbf{v} \in V에 대해 T(\mathbf{u}) = T(\mathbf{v})이면, 가법성과 음원의 보존에 의해 T(\mathbf{u} - \mathbf{v}) = \mathbf{0}_{W}이므로 \mathbf{u} - \mathbf{v} \in \mathrm{Ker}(T) = \{ \mathbf{0}_{V} \}, 즉 \mathbf{u} = \mathbf{v}이다. 따라서 T는 단사이다.

2.3 행렬에 의한 판별

행렬 A \in \mathbb{F}^{m \times n}에 의해 정의되는 사상에 대해서는, 단사성이 다음 조건과 모두 동치이다.

(i) \mathrm{Null}(A) = \{ \mathbf{0} \}
(ii) A의 열들이 선형 독립이다.
(iii) \mathrm{rank}(A) = n (즉, A의 계수가 정의역의 차원과 같다.)
(iv) 정사각 행렬 A^{\top} A \in \mathbb{F}^{n \times n}이 가역이다.

조건 (iii)으로부터 단사성이 가능하기 위한 차원적 필요조건이 n \le m임이 따라 나온다. 즉, 정의역의 차원이 공역의 차원보다 큰 경우에는 어떠한 선형 변환도 단사가 될 수 없다.

3. 전사 선형 변환의 판별

3.1 상의 조건

선형 변환 T : V \to W가 전사일 필요충분조건은 그 상이 공역 전체와 일치하는 것, 즉

\mathrm{Im}(T) = W

이다. 이는 전사의 정의 그 자체이며 별도의 증명을 요하지 않는다.

3.2 행렬에 의한 판별

행렬 A \in \mathbb{F}^{m \times n}에 대해서는 전사성이 다음 조건과 모두 동치이다.

(i) \mathrm{Col}(A) = \mathbb{F}^{m}
(ii) A의 행들이 선형 독립이다.
(iii) \mathrm{rank}(A) = m (즉, 계수가 공역의 차원과 같다.)
(iv) 정사각 행렬 A A^{\top} \in \mathbb{F}^{m \times m}이 가역이다.

조건 (iii)으로부터 전사성이 가능하기 위한 차원적 필요조건이 m \le n임이 따라 나온다. 즉, 정의역의 차원이 공역의 차원보다 작은 경우에는 어떠한 선형 변환도 전사가 될 수 없다.

4. 전단사 선형 변환의 판별

4.1 동치 조건

선형 변환 T : V \to W가 전단사일 필요충분조건은 단사이면서 동시에 전사인 것, 즉

\mathrm{Ker}(T) = \{ \mathbf{0}_{V} \} \quad \text{이고} \quad \mathrm{Im}(T) = W

가 동시에 성립하는 것이다.

4.2 차원적 필요조건

위의 단사·전사 판별 결과로부터, 전단사 선형 변환이 존재하기 위한 필요조건은 정의역과 공역의 차원이 일치하는 것이다. 즉,

\dim(V) = \dim(W)

가 성립해야 한다. 만약 두 차원이 다르다면, 단사 또는 전사 가운데 하나는 결코 만족될 수 없다.

4.3 차원이 같을 때의 동치성

매우 중요한 결과로, 정의역과 공역의 차원이 동일한 유한차원 벡터 공간 사이의 선형 변환에 대해서는 다음 세 조건이 모두 동치이다.

(i) T는 단사이다.
(ii) T는 전사이다.
(iii) T는 전단사이다.

4.4 동치성의 증명

차원 정리

\dim(V) = \dim(\mathrm{Ker}(T)) + \dim(\mathrm{Im}(T))

\dim(V) = \dim(W)의 가정을 결합한다. 만약 T가 단사이면 \dim(\mathrm{Ker}(T)) = 0이므로 \dim(\mathrm{Im}(T)) = \dim(V) = \dim(W)가 되며, 따라서 \mathrm{Im}(T) = W, 즉 T는 전사이다. 역으로 T가 전사이면 \dim(\mathrm{Im}(T)) = \dim(W) = \dim(V)이므로 \dim(\mathrm{Ker}(T)) = 0, 즉 \mathrm{Ker}(T) = \{ \mathbf{0}_{V} \}이고 T는 단사이다. 따라서 두 조건은 서로 동치이며, 이로부터 (i)과 (ii)가 모두 (iii)과 동치임이 따라 나온다.

이 결과는 일반적인 함수에 대해서는 결코 성립하지 않는, 유한차원 선형대수의 매우 특별한 성질이다. 일반적인 함수의 경우 단사이면서 전사가 아닐 수 있고 전사이면서 단사가 아닐 수 있지만, 정의역과 공역이 동일한 유한차원의 벡터 공간이고 사상이 선형이라면 두 성질은 자동으로 동시에 성립하거나 동시에 부재한다.

5. 정사각 행렬의 가역성과의 관계

정사각 행렬 A \in \mathbb{F}^{n \times n}이 정의하는 선형 변환 T(\mathbf{v}) = A \mathbf{v}에 대해서는, 위의 동치성으로부터 가역 행렬 정리(Invertible Matrix Theorem)의 핵심 부분이 즉각 도출된다. 다음 조건들이 모두 동치이다.

(i) A는 가역이다.
(ii) T는 단사이다.
(iii) T는 전사이다.
(iv) T는 전단사이다.
(v) \mathrm{Null}(A) = \{ \mathbf{0} \}이다.
(vi) \mathrm{Col}(A) = \mathbb{F}^{n}이다.
(vii) \mathrm{rank}(A) = n이다.
(viii) \det(A) \neq 0이다.
(ix) A의 모든 고유값이 0이 아니다.
(x) A^{\top} A가 가역이다.
(xi) 임의의 \mathbf{b} \in \mathbb{F}^{n}에 대해 A \mathbf{x} = \mathbf{b}가 유일한 해를 가진다.

이러한 길고 풍부한 동치성은 정사각 행렬에 대해 단 한 가지 조건만 확인하면 다른 모든 조건이 자동으로 따라 나온다는 사실을 의미하며, 실용적으로 매우 강력한 도구이다.

6. 동형(Isomorphism)으로서의 전단사 선형 변환

전단사 선형 변환은 흔히 동형 사상(Isomorphism)이라 불린다. 두 벡터 공간 VW 사이에 동형 사상이 존재할 때, 두 공간은 서로 동형(Isomorphic)이라 부르며, 통상 V \cong W로 표기한다. 동형은 단순한 일대일 대응이 아니라 벡터 공간 구조를 완전히 보존하는 대응이며, 동형인 두 공간은 본질적으로 동일한 선형대수적 구조를 가진다.

6.1 차원에 의한 분류

유한차원 벡터 공간의 동형 분류는 매우 단순하다. 동일한 체 \mathbb{F} 위의 두 유한차원 벡터 공간 VW가 동형일 필요충분조건은 \dim(V) = \dim(W)이다. 즉, 차원만이 유일한 동형 불변량(Invariant)이며, \mathbb{F} 위의 모든 n차원 벡터 공간은 동형 사상에 의해 \mathbb{F}^{n}과 동일시될 수 있다. 이 결과는 행렬과 벡터를 이용한 모든 분석이 추상적 벡터 공간 위에서도 그대로 적용될 수 있음을 정당화한다.

7. 무한차원에서의 차이

주의해야 할 점은, 위의 동치성과 차원에 의한 분류가 모두 유한차원 가정에 본질적으로 의존한다는 사실이다. 무한차원 벡터 공간에서는 단사이지만 전사가 아닌 선형 사상이나, 전사이지만 단사가 아닌 선형 사상이 흔히 존재한다.

대표적 사례는 수열 공간 \ell^{2} 위의 오른쪽 이동 연산자(Right Shift Operator) R(x_{1}, x_{2}, x_{3}, \ldots) = (0, x_{1}, x_{2}, x_{3}, \ldots)이다. 이 사상은 단사이지만 전사가 아니다. 반대로 왼쪽 이동 연산자(Left Shift Operator) L(x_{1}, x_{2}, x_{3}, \ldots) = (x_{2}, x_{3}, x_{4}, \ldots)는 전사이지만 단사가 아니다. 두 사상은 모두 선형이지만, 무한차원에서는 단사·전사가 결코 동치가 되지 않는다.

이러한 차이는 차원 정리가 무한차원에서는 그 형태 그대로 성립하지 않으며, 함수 해석학(Functional Analysis)에서 별도의 정밀한 도구를 필요로 한다는 사실의 반영이다.

8. 신경망에서의 응용

8.1 가역 신경망과 정규화 흐름

정규화 흐름(Normalizing Flow) 모형은 생성 모델의 한 부류로, 단순한 분포(예: 표준 가우시안)로부터 복잡한 자료 분포로의 가역적 변환을 학습한다. 이 모형이 작동하기 위해서는 모든 계층이 전단사여야 하며, 그래야만 변환의 야코비안과 그 역을 모두 계산할 수 있다. 이때 가장 단순한 형태인 선형 계층의 가역성은 본 절에서 다룬 행렬의 단사·전사 판별 조건에 의해 정확히 보장되며, 가중치 행렬의 행렬식이 0이 아니거나 LU 분해가 가능하도록 매개변수가 설계된다.

8.2 임베딩의 단사성

임베딩 행렬 E \in \mathbb{R}^{m \times n}이 서로 다른 토큰을 서로 다른 벡터로 사상하는 단사 사상이 되기 위해서는, 그 행렬의 행들이 선형 독립이어야 한다는 조건과 동치이다. 그러나 실제로 임베딩 행렬은 학습 중에 서로 가까운 의미를 가진 토큰들이 서로 가까운 벡터로 매핑되도록 학습되며, 단사성 자체는 보장되지 않는 것이 일반적이다. 이 사실은 임베딩의 단사성과 의미 보존 사이의 절충이 학습 목적에 따라 달라질 수 있음을 보여 준다.

9. 결론

선형 변환의 단사·전사·전단사 판별은 일반적인 함수 이론과 달리 매우 단순한 형태로 환원된다. 단사성은 핵의 자명성과 동치이고, 전사성은 상이 공역 전체와 일치하는 것과 동치이며, 정의역과 공역의 차원이 같은 유한차원에서는 단사·전사·전단사가 모두 동치이다. 이러한 구조는 차원 정리에 의해 자연스럽게 따라 나오며, 가역 행렬 정리, 동형 사상의 차원 분류, 가역 신경망의 설계 등 광범위한 영역에서 핵심적 도구로 사용된다. 동시에 무한차원에서는 이러한 동치성이 일반적으로 성립하지 않는다는 사실은, 유한차원 선형대수가 가지는 매우 특수한 성질을 반영하는 결과이다.