29.5 사영(Projection) 변환의 정의와 직교 사영의 기하학적 의미
1. 사영의 형식적 정의
벡터 공간 V 위에서 정의된 선형 변환 P : V \to V가 다음 조건을 만족할 때, P를 사영(Projection)이라 부른다.
P^{2} = P
즉, 사영은 자기 자신과 합성하면 자신과 동일해지는 선형 변환이다. 이러한 성질을 가지는 변환을 일반적으로 멱등(Idempotent) 사상이라 부른다. 사영의 본질적 의미는, 한 번의 적용으로 정의역의 모든 벡터가 어떤 부분 공간 위로 옮겨지고, 그 이후의 추가적인 적용은 이미 옮겨진 벡터를 변화시키지 않는다는 데 있다. 즉, 사영의 상(Image)에 속한 벡터는 사영에 대한 고정점(Fixed Point)이다.
2. 사영의 부분 공간 분해
선형 사영 P가 주어졌을 때, 정의역 V는 다음과 같이 두 부분 공간의 직합(Direct Sum)으로 분해된다.
V = \mathrm{Im}(P) \oplus \mathrm{Ker}(P)
여기서 \mathrm{Im}(P) = \{ P(\mathbf{v}) : \mathbf{v} \in V \}는 사영의 상, \mathrm{Ker}(P) = \{ \mathbf{v} \in V : P(\mathbf{v}) = \mathbf{0} \}는 사영의 핵이다. 직합 분해가 성립하는 이유는 다음과 같다. 임의의 \mathbf{v} \in V에 대하여
\mathbf{v} = P(\mathbf{v}) + (\mathbf{v} - P(\mathbf{v}))
로 분해할 때, 첫째 항은 정의에 의해 \mathrm{Im}(P)에 속하며, 둘째 항에 P를 적용하면
P(\mathbf{v} - P(\mathbf{v})) = P(\mathbf{v}) - P^{2}(\mathbf{v}) = P(\mathbf{v}) - P(\mathbf{v}) = \mathbf{0}
이므로 \mathrm{Ker}(P)에 속한다. 또한 \mathbf{v}가 \mathrm{Im}(P) \cap \mathrm{Ker}(P)에 동시에 속한다면, \mathbf{v} = P(\mathbf{u})이고 P(\mathbf{v}) = \mathbf{0}이므로 \mathbf{v} = P(\mathbf{u}) = P^{2}(\mathbf{u}) = P(P(\mathbf{u})) = P(\mathbf{v}) = \mathbf{0}이 되어, 두 부분 공간의 교집합이 영벡터뿐임을 알 수 있다. 따라서 V는 두 부분 공간의 직합으로 분해된다.
이러한 분해는 사영을 한 부분 공간에 평행한 방향으로 다른 부분 공간 위로 떨어뜨리는 사상으로 해석할 수 있게 한다. 즉, \mathrm{Ker}(P)의 방향을 따라 \mathrm{Im}(P) 위로 떨어뜨리는 작용이 사영의 본질적 의미이다.
3. 일반적 사영과 직교 사영의 구분
위의 정의에서 \mathrm{Im}(P)와 \mathrm{Ker}(P)는 일반적으로 임의의 두 보완적 부분 공간이며, 반드시 서로 수직일 필요는 없다. 이러한 경우의 사영을 사선 사영(Oblique Projection)이라 부른다. 반대로 \mathrm{Im}(P)와 \mathrm{Ker}(P)가 내적에 대해 서로 직교할 때, 즉
\langle \mathbf{u}, \mathbf{v} \rangle = 0, \quad \forall \mathbf{u} \in \mathrm{Im}(P), \ \forall \mathbf{v} \in \mathrm{Ker}(P)
가 성립할 때, P를 직교 사영(Orthogonal Projection)이라 부른다. 본 절에서 주로 다루는 대상은 이 직교 사영이며, 그 기하학적 의미가 가장 명료하기 때문이다.
4. 직교 사영의 형식적 특징
내적이 부여된 유한차원 실벡터 공간에서 사영 P가 직교 사영이 되기 위한 필요충분조건은 다음 두 조건이 모두 성립하는 것이다.
(i) P^{2} = P (멱등성)
(ii) P^{\top} = P (자기 수반성, Self-Adjointness)
즉, 직교 사영은 정확히 멱등이면서 동시에 대칭인 행렬에 대응된다. 두 조건의 결합은, 사영의 상과 핵이 내적에 대해 직교한다는 사실을 보장한다.
5. 부분 공간 위로의 직교 사영 공식
\mathbb{R}^{n}의 부분 공간 U가 직교 정규(Orthonormal) 기저 \{ \mathbf{u}_1, \mathbf{u}_2, \ldots, \mathbf{u}_k \}를 가질 때, U 위로의 직교 사영은 다음의 명시적 공식으로 주어진다.
P_{U}(\mathbf{v}) = \sum_{i=1}^{k} \langle \mathbf{v}, \mathbf{u}_i \rangle \mathbf{u}_i
행렬 형태로는, U의 직교 정규 기저를 열로 하는 n \times k 행렬을 Q라 할 때 다음과 같이 표현된다.
P_{U} = Q Q^{\top}
이 행렬은 P_{U}^{\top} = (Q Q^{\top})^{\top} = Q Q^{\top} = P_{U}로 자기 수반이며, P_{U}^{2} = Q Q^{\top} Q Q^{\top} = Q (Q^{\top} Q) Q^{\top} = Q I Q^{\top} = Q Q^{\top} = P_{U}로 멱등이므로 직교 사영의 두 조건을 모두 만족한다. 여기서 Q^{\top} Q = I_{k}가 성립하는 이유는 Q의 열들이 직교 정규이기 때문이다.
기저가 직교 정규가 아닌 일반적 경우에는, U의 임의의 기저를 열로 하는 n \times k 행렬 A에 대해 직교 사영은 다음과 같이 표현된다.
P_{U} = A (A^{\top} A)^{-1} A^{\top}
이는 일반적인 정칙(Regular) 기저에 대한 표준 공식이며, 후속 절에서 다룰 최소 제곱법(Least Squares Method)의 기하학적 핵심을 이룬다.
6. 직교 사영의 기하학적 의미
직교 사영 P_{U}가 임의의 벡터 \mathbf{v}에 작용한 결과 P_{U}(\mathbf{v})는, U 안에서 \mathbf{v}에 가장 가까운 유일한 점이라는 의미를 가진다. 즉, 다음 최적화 문제의 해이다.
P_{U}(\mathbf{v}) = \arg\min_{\mathbf{u} \in U} \Vert \mathbf{v} - \mathbf{u} \Vert
이 사실은 다음과 같이 증명된다. 임의의 \mathbf{u} \in U에 대하여 \mathbf{v} - \mathbf{u} = (\mathbf{v} - P_{U}(\mathbf{v})) + (P_{U}(\mathbf{v}) - \mathbf{u})로 분해하면, 첫째 항은 \mathrm{Ker}(P_{U}) = U^{\perp}에 속하고 둘째 항은 U에 속하므로 두 항은 서로 직교한다. 따라서 피타고라스 정리에 의해
\Vert \mathbf{v} - \mathbf{u} \Vert^{2} = \Vert \mathbf{v} - P_{U}(\mathbf{v}) \Vert^{2} + \Vert P_{U}(\mathbf{v}) - \mathbf{u} \Vert^{2}
가 성립하며, 우변의 둘째 항은 \mathbf{u} = P_{U}(\mathbf{v})일 때 최솟값 0을 가진다. 따라서 \mathbf{u} = P_{U}(\mathbf{v})가 거리를 최소화하는 유일한 점이다.
이러한 기하학적 의미는 직교 사영을 “벡터를 부분 공간 위로 수직으로 떨어뜨리는 작용“으로 해석할 수 있게 한다. 정의역의 벡터 \mathbf{v}로부터 그 사영점 P_{U}(\mathbf{v})로 가는 차이 벡터 \mathbf{v} - P_{U}(\mathbf{v})는 항상 부분 공간 U에 수직이며, 그 길이는 \mathbf{v}로부터 U까지의 최단 거리에 정확히 일치한다.
7. 단일 벡터 위로의 직교 사영
가장 단순하면서도 가장 자주 등장하는 사례는, 한 단위 벡터 \mathbf{u}가 펼치는 1차원 부분 공간 위로의 직교 사영이다. 이 경우 사영 공식은 다음으로 환원된다.
P_{\mathbf{u}}(\mathbf{v}) = \langle \mathbf{v}, \mathbf{u} \rangle \mathbf{u}
여기서 스칼라 \langle \mathbf{v}, \mathbf{u} \rangle는 \mathbf{v}의 \mathbf{u} 방향 성분이며, 이를 \mathbf{u}에 곱한 결과가 사영 벡터이다. 이러한 단일 벡터 사영은 그람-슈미트(Gram-Schmidt) 직교화 절차의 핵심 단계이며, 한 벡터로부터 다른 벡터의 평행 성분을 제거함으로써 직교 성분을 얻는 데 사용된다.
8. 보완 사영과 항등 분해
직교 사영 P_{U}가 주어지면, 그 보완 사영(Complementary Projection) P_{U^{\perp}} = I - P_{U}도 직교 사영이 되며, 이는 직교 여공간 U^{\perp} 위로의 사영이다. 두 사영은 다음의 분해 항등식을 만족한다.
\mathbf{v} = P_{U}(\mathbf{v}) + P_{U^{\perp}}(\mathbf{v}), \quad \forall \mathbf{v} \in V
이는 임의의 벡터를 부분 공간 안의 성분과 그에 수직인 성분의 합으로 유일하게 분해할 수 있다는 사실을 의미한다. 또한 두 직교 사영은 P_{U} P_{U^{\perp}} = P_{U^{\perp}} P_{U} = 0을 만족하므로 서로 소거된다.
9. 응용 사례
9.1 최소 제곱법
선형 회귀 문제 \min_{\mathbf{x}} \Vert A \mathbf{x} - \mathbf{b} \Vert^{2}의 해는 정확히 \mathbf{b}를 A의 열공간(Column Space) 위로 직교 사영한 점에 대응한다. 정상 방정식 A^{\top} A \mathbf{x} = A^{\top} \mathbf{b}를 풀면 \mathbf{x} = (A^{\top} A)^{-1} A^{\top} \mathbf{b}를 얻으며, 이를 다시 A에 곱하면 사영 행렬 A (A^{\top} A)^{-1} A^{\top}이 등장한다.
9.2 차원 축소
주성분 분석(PCA)은 자료 행렬의 공분산 행렬의 고유 벡터들이 펼치는 부분 공간 위로 데이터를 직교 사영함으로써 차원을 축소하는 절차로 해석된다. 따라서 PCA의 본질은 직교 사영이며, 그 부분 공간의 선택은 자료의 분산을 가장 잘 보존하는 방향에 의해 결정된다.
9.3 신경망에서의 사영
직교 사영 행렬은 신경망의 일부 구성 요소에서도 직접 등장한다. 예를 들어 직교 정칙화(Orthogonal Regularization)는 가중치 행렬이 직교 행렬에 가까워지도록 유도하는 기법이며, 이는 학습 동역학의 안정성 향상에 기여한다. 또한 일부 어텐션 기반 모델은 질의 벡터를 키 벡터들이 펼치는 부분 공간 위로 사영하는 방식으로 가중합을 정규화하기도 한다.
10. 결론
사영 변환은 멱등성이라는 단일한 대수적 조건에 의해 정의되며, 그 결과 정의역을 상과 핵의 직합으로 분해하는 사상이다. 그 가운데 가장 기하학적으로 자연스러운 형태인 직교 사영은, 주어진 벡터를 어떤 부분 공간 안에서 가장 가까운 점으로 보내는 작용으로 해석되며, 자기 수반성과 멱등성의 결합에 의해 형식적으로 특징지어진다. 직교 사영은 최소 제곱법, 그람-슈미트 직교화, 주성분 분석, 정규 방정식, 신경망의 정칙화 등 매우 다양한 영역에서 핵심적 역할을 수행하며, 선형대수학과 그 응용을 잇는 가장 중요한 다리 가운데 하나이다.