29.10 선형 변환의 행렬 표현(Matrix Representation)

1. 행렬 표현의 도입 동기

추상적 선형 변환은 두 벡터 공간 사이에서 정의되는 사상이며, 그 자체로는 어떠한 좌표 표현도 전제하지 않는다. 그러나 유한차원 벡터 공간 위에서 선형 변환을 다룰 때는 정의역과 공역에 각각 기저를 한 번 고정함으로써, 그 사상을 단 하나의 행렬로 환원할 수 있다. 이러한 환원은 추상적 대수 구조와 구체적 수치 계산 사이의 다리를 제공하며, 모든 컴퓨터 구현과 모든 행렬 분해 이론의 출발점이 된다. 본 절에서는 선형 변환의 행렬 표현이 어떻게 정의되며, 그 표현이 어떤 일관성과 유일성을 가지는지를 형식적으로 다룬다.

2. 정의역과 공역의 기저 고정

체 $\mathbb{F}$ 위의 두 유한차원 벡터 공간 $V$ 와 $W$ 를 생각한다. $V$ 의 차원을 $n$ , $W$ 의 차원을 $m$ 이라 하자. $V$ 에 정렬된 기저(Ordered Basis) $\mathcal{B} = (\mathbf{v}_{1}, \mathbf{v}_{2}, \ldots, \mathbf{v}_{n})$ 을 고정하고, $W$ 에 정렬된 기저 $\mathcal{C} = (\mathbf{w}_{1}, \mathbf{w}_{2}, \ldots, \mathbf{w}_{m})$ 을 고정한다. 정렬된 기저라 함은 단순한 집합이 아니라 순서가 부여된 기저이며, 좌표 표현을 위해서는 순서가 본질적이기 때문이다.

이 두 기저가 고정되면, $V$ 의 임의의 벡터 $\mathbf{v}$ 는 다음과 같이 유일한 좌표 표현을 가진다.

$\mathbf{v} = \sum_{j=1}^{n} a_{j} \mathbf{v}_{j}, \quad [\mathbf{v}]_{\mathcal{B}} = \begin{pmatrix} a_{1} \\ a_{2} \\ \vdots \\ a_{n} \end{pmatrix} \in \mathbb{F}^{n}$

여기서 $[\mathbf{v}]_{\mathcal{B}}$ 는 기저 $\mathcal{B}$ 에 대한 $\mathbf{v}$ 의 좌표 벡터(Coordinate Vector)이다. 마찬가지로 $W$ 의 임의의 벡터에 대해서도 기저 $\mathcal{C}$ 에 대한 좌표 벡터가 정의된다.

3. 행렬 표현의 형식적 정의

이제 선형 변환 $T : V \to W$ 가 주어졌다고 하자. $T$ 의 기저쌍 $(\mathcal{B}, \mathcal{C})$ 에 대한 행렬 표현(Matrix Representation)은, 각 기저 벡터 $\mathbf{v}_{j}$ 의 상 $T(\mathbf{v}_{j})$ 를 기저 $\mathcal{C}$ 로 전개한 좌표 벡터를 열로 차례로 나열한 $m \times n$ 행렬로 정의된다.

$[T]_{\mathcal{B}}^{\mathcal{C}} = \big[ [T(\mathbf{v}_{1})]_{\mathcal{C}} \ \ [T(\mathbf{v}_{2})]_{\mathcal{C}} \ \ \cdots \ \ [T(\mathbf{v}_{n})]_{\mathcal{C}} \big]$

좌표 표현을 사용하여 명시적으로 풀어 쓰면, $T(\mathbf{v}_{j}) = \sum_{i=1}^{m} a_{ij} \mathbf{w}_{i}$ 일 때 행렬의 $(i, j)$ 원소는

$\big( [T]_{\mathcal{B}}^{\mathcal{C}} \big)_{ij} = a_{ij}$

가 된다. 즉, 행렬의 $j$ 번째 열은 $j$ 번째 정의역 기저 벡터의 상이 공역 기저로 어떻게 분해되는가를 나타낸다.

4. 좌표와 행렬 곱셈의 일관성

행렬 표현의 가장 중요한 성질은, 임의의 입력 벡터의 좌표에 대해 행렬을 곱한 결과가 그 벡터의 사상의 좌표와 일치한다는 사실이다. 형식적으로는 다음의 등식이 성립한다.

$[T(\mathbf{v})]_{\mathcal{C}} = [T]_{\mathcal{B}}^{\mathcal{C}} \cdot [\mathbf{v}]_{\mathcal{B}}, \quad \forall \mathbf{v} \in V$

4.1 등식의 증명

임의의 $\mathbf{v} \in V$ 를 기저 $\mathcal{B}$ 로 전개하면 $\mathbf{v} = \sum_{j} a_{j} \mathbf{v}_{j}$ 이고, $T$ 의 선형성에 의해

$T(\mathbf{v}) = \sum_{j=1}^{n} a_{j} T(\mathbf{v}_{j}) = \sum_{j=1}^{n} a_{j} \sum_{i=1}^{m} a_{ij} \mathbf{w}_{i} = \sum_{i=1}^{m} \left( \sum_{j=1}^{n} a_{ij} a_{j} \right) \mathbf{w}_{i}$

가 성립한다. 따라서 $[T(\mathbf{v})]_{\mathcal{C}}$ 의 $i$ 번째 성분은 $\sum_{j=1}^{n} a_{ij} a_{j}$ 이며, 이는 정확히 행렬 $[T]_{\mathcal{B}}^{\mathcal{C}}$ 의 $i$ 번째 행과 좌표 벡터 $[\mathbf{v}]_{\mathcal{B}}$ 의 행렬 곱셈 결과의 $i$ 번째 성분과 일치한다. 이로써 위 등식이 증명된다.

이러한 일관성은 행렬 표현이 단지 표기적 편의가 아니라, 추상적 사상 $T$ 를 구체적인 좌표 계산으로 환원하는 수학적 동치임을 보장한다. 이로부터 모든 선형대수학의 수치 계산은 사실상 좌표 벡터에 행렬을 곱하는 절차로 환원된다.

5. 표현의 유일성

기저쌍 $(\mathcal{B}, \mathcal{C})$ 가 한 번 고정되면, 선형 변환 $T$ 의 행렬 표현은 유일하게 결정된다. 만약 두 행렬 $A_{1}, A_{2} \in \mathbb{F}^{m \times n}$ 이 동일한 사상 $T$ 를 표현한다면, 모든 좌표 벡터 $[\mathbf{v}]_{\mathcal{B}}$ 에 대해 $A_{1} [\mathbf{v}]_{\mathcal{B}} = A_{2} [\mathbf{v}]_{\mathcal{B}}$ 가 성립하여야 한다. 이를 모든 표준 기저 좌표 벡터에 적용하면 $A_{1}$ 과 $A_{2}$ 의 모든 열이 동일하므로 $A_{1} = A_{2}$ 이다. 따라서 기저쌍이 고정된 상황에서 행렬 표현은 유일하다.

역으로, 임의의 행렬 $A \in \mathbb{F}^{m \times n}$ 이 주어지면, 그 행렬을 행렬 표현으로 가지는 유일한 선형 변환 $T$ 가 존재한다. 즉, 기저쌍 $(\mathcal{B}, \mathcal{C})$ 가 고정된 상태에서 $V$ 에서 $W$ 로의 선형 변환과 $\mathbb{F}^{m \times n}$ 의 행렬 사이에는 자연스러운 일대일 대응이 존재한다.

6. 표준 기저에 대한 행렬 표현

특히 $V = \mathbb{F}^{n}$ , $W = \mathbb{F}^{m}$ 이고 정렬된 표준 기저 $\mathcal{E}_{n} = (\mathbf{e}_{1}, \ldots, \mathbf{e}_{n})$ , $\mathcal{E}_{m} = (\mathbf{e}_{1}, \ldots, \mathbf{e}_{m})$ 을 사용하는 경우, 임의의 벡터의 좌표 벡터는 그 벡터 자체와 일치한다. 따라서 $T : \mathbb{F}^{n} \to \mathbb{F}^{m}$ 의 표준 기저에 대한 행렬 표현은 다음과 같이 단순화된다.

$[T] = \big[ T(\mathbf{e}_{1}) \ \ T(\mathbf{e}_{2}) \ \ \cdots \ \ T(\mathbf{e}_{n}) \big]$

즉, 표준 기저에 대한 행렬 표현의 $j$ 번째 열은 정확히 $j$ 번째 표준 기저 벡터의 상이다. 이러한 단순화는 컴퓨터 구현에서 가장 자주 사용되는 형태이며, 일반적으로 “선형 변환과 그 행렬은 동일한 것“이라는 통념의 근거가 된다.

7. 합성 사상의 행렬 표현

두 선형 변환 $T : V \to W$ 와 $S : W \to U$ 가 주어지고, $V$ 에 기저 $\mathcal{B}$ , $W$ 에 기저 $\mathcal{C}$ , $U$ 에 기저 $\mathcal{D}$ 가 고정되어 있다고 하자. 그러면 합성 사상 $S \circ T : V \to U$ 의 행렬 표현은 두 행렬 표현의 곱으로 주어진다.

$[S \circ T]_{\mathcal{B}}^{\mathcal{D}} = [S]_{\mathcal{C}}^{\mathcal{D}} \cdot [T]_{\mathcal{B}}^{\mathcal{C}}$

7.1 증명

임의의 $\mathbf{v} \in V$ 에 대하여, 좌표와 사상의 일관성으로부터

$[(S \circ T)(\mathbf{v})]_{\mathcal{D}} = [S(T(\mathbf{v}))]_{\mathcal{D}} = [S]_{\mathcal{C}}^{\mathcal{D}} \cdot [T(\mathbf{v})]_{\mathcal{C}} = [S]_{\mathcal{C}}^{\mathcal{D}} \cdot [T]_{\mathcal{B}}^{\mathcal{C}} \cdot [\mathbf{v}]_{\mathcal{B}}$

가 성립한다. 한편 합성 사상의 행렬 표현 정의로부터

$[(S \circ T)(\mathbf{v})]_{\mathcal{D}} = [S \circ T]_{\mathcal{B}}^{\mathcal{D}} \cdot [\mathbf{v}]_{\mathcal{B}}$

이므로, 표현의 유일성에 의해 두 행렬 $[S \circ T]_{\mathcal{B}}^{\mathcal{D}}$ 와 $[S]_{\mathcal{C}}^{\mathcal{D}} \cdot [T]_{\mathcal{B}}^{\mathcal{C}}$ 가 일치한다.

이 결과는 행렬 곱셈이 단순한 표기 관습이 아니라, 사상의 합성이라는 본질적 연산을 좌표로 표현한 결과임을 보여 준다. 즉, 행렬 곱셈의 순서, 결합 법칙, 분배 법칙은 모두 사상 합성의 대응되는 성질로부터 자연스럽게 따라 나온다.

8. 가역 사상의 행렬 표현

$T : V \to W$ 가 전단사 선형 변환이고, 정의역과 공역의 차원이 동일하며 두 공간 모두에 기저가 고정되어 있다면, 그 역사상 $T^{-1} : W \to V$ 의 행렬 표현은 $T$ 의 행렬 표현의 역행렬과 일치한다.

$[T^{-1}]_{\mathcal{C}}^{\mathcal{B}} = \big( [T]_{\mathcal{B}}^{\mathcal{C}} \big)^{-1}$

이는 합성 사상의 행렬 표현 결과를 $T \circ T^{-1} = \mathrm{id}_{W}$ , $T^{-1} \circ T = \mathrm{id}_{V}$ 에 적용함으로써 즉각 얻어진다. 이로부터 행렬의 가역성과 사상의 가역성이 정확히 일치하며, 가역 행렬 정리가 다시 한 번 동등한 형식으로 표현된다.

9. 신경망 가중치 행렬과의 관계

딥러닝의 완전 결합 계층 $\mathbf{y} = W \mathbf{x} + \mathbf{b}$ 에서 가중치 행렬 $W$ 는 본질적으로 입력 공간 $\mathbb{R}^{n}$ 에서 출력 공간 $\mathbb{R}^{m}$ 으로의 선형 변환을 표준 기저쌍에 대해 표현한 행렬이다. 즉, $W$ 의 $j$ 번째 열은 $j$ 번째 입력 표준 기저 벡터에 대응되는 출력 벡터이며, $j$ 번째 입력 좌표가 출력에 기여하는 방식을 직접 부호화한다. 이러한 관점은 가중치 행렬의 각 열을 단순한 매개변수의 묶음이 아니라, 입력 한 좌표가 학습한 출력 패턴으로 해석하는 시각의 토대가 된다. 합성곱 계층에서도 동일한 해석이 가능하지만, 가중치 공유라는 추가적 제약이 부여된다.

10. 결론

선형 변환의 행렬 표현은 정의역과 공역에 기저쌍을 고정함으로써 추상적 사상을 구체적인 행렬로 환원하는 절차이며, 이 환원은 좌표와 행렬 곱셈의 일관성에 의해 수학적으로 정당화된다. 표현은 기저쌍이 고정된 상황에서 유일하게 결정되며, 사상의 합성은 행렬의 곱셈에, 사상의 가역성은 행렬의 역에 정확히 대응한다. 이러한 결과는 선형대수학의 모든 행렬 계산이 단순한 수치 조작이 아니라, 그 배후에 있는 사상의 본질적 성질을 표현하는 도구임을 의미하며, 동시에 신경망의 가중치 행렬을 사상으로 해석하는 관점을 정당화하는 근거가 된다.