27.10 정규 기저(Standard Basis)와 좌표 표현 체계

1. 정규 기저의 정의

$\mathbb{R}^n$ 의 정규 기저(standard basis) 또는 표준 기저는 $n$ 개의 단위 벡터 $\mathcal{E} = \{\mathbf{e}_1, \mathbf{e}_2, \ldots, \mathbf{e}_n\}$ 으로 구성된다. 여기서 $\mathbf{e}_i$ 는 크로네커 델타(Kronecker delta)를 이용하여 다음과 같이 정의된다.

$(\mathbf{e}_i)_j = \delta_{ij} = \begin{cases} 1 & \text{if } i = j \\ 0 & \text{if } i \neq j \end{cases}$

즉 $\mathbf{e}_i$ 의 $i$ 번째 성분만 1이고 나머지 성분은 모두 0이다. 표준 기저가 실제로 $\mathbb{R}^n$ 의 기저임을 확인하려면 두 가지를 보여야 한다.

선형 독립: $\sum_{i=1}^n \alpha_i \mathbf{e}_i = \mathbf{0}$ 이면, 좌변의 $j$ 번째 성분이 $\alpha_j$ 이므로 모든 $\alpha_j = 0$ 이다.

생성: 임의의 $\mathbf{v} = (v_1, v_2, \ldots, v_n)^\top \in \mathbb{R}^n$ 에 대하여 $\mathbf{v} = \sum_{i=1}^n v_i \mathbf{e}_i$ 가 성립한다.

표준 기저는 추가적으로 정규 직교성(orthonormality)을 만족한다.

$\langle \mathbf{e}_i, \mathbf{e}_j \rangle = \delta_{ij}$

이는 서로 다른 기저 벡터가 직교(orthogonal)하며 각 기저 벡터의 노름이 1임을 의미한다.

2. 좌표 표현 체계

순서 기저(ordered basis) $\mathcal{B} = (\mathbf{b}_1, \mathbf{b}_2, \ldots, \mathbf{b}_n)$ 이 주어진 벡터 공간 $V$ 에서, 임의의 $\mathbf{v} \in V$ 는 유일한 선형 결합

$\mathbf{v} = \alpha_1 \mathbf{b}_1 + \alpha_2 \mathbf{b}_2 + \cdots + \alpha_n \mathbf{b}_n$

으로 표현된다. 이때의 계수 $(\alpha_1, \alpha_2, \ldots, \alpha_n)^\top$ 을 기저 $\mathcal{B}$ 에 대한 $\mathbf{v}$ 의 좌표 벡터(coordinate vector)라 하며, $[\mathbf{v}]_\mathcal{B}$ 로 표기한다.

좌표 사상(coordinate map) $\phi_\mathcal{B}: V \to \mathbb{R}^n$ 은 $\phi_\mathcal{B}(\mathbf{v}) = [\mathbf{v}]_\mathcal{B}$ 로 정의되며, 이 사상은 선형이고 전단사(bijective)이다. 따라서 좌표 사상은 벡터 공간 동형 사상(isomorphism)이며, $n$ 차원 벡터 공간은 모두 $\mathbb{R}^n$ 과 동형이다.

표준 기저 $\mathcal{E}$ 에 대한 좌표 벡터는 벡터 자체와 일치한다.

$[\mathbf{v}]_\mathcal{E} = \mathbf{v}$

이 성질 때문에 $\mathbb{R}^n$ 에서 작업할 때에는 좌표 벡터와 벡터를 별도로 구분하지 않는 경우가 많다.

3. 기저 변환 행렬

두 기저 $\mathcal{B} = (\mathbf{b}_1, \ldots, \mathbf{b}_n)$ 과 $\mathcal{B}' = (\mathbf{b}'_1, \ldots, \mathbf{b}'_n)$ 이 주어졌을 때, 기저 변환 행렬(change of basis matrix) $P_{\mathcal{B} \to \mathcal{B}'}$ 는 다음 관계를 만족한다.

$[\mathbf{v}]_{\mathcal{B}'} = P_{\mathcal{B} \to \mathcal{B}'} [\mathbf{v}]_\mathcal{B}$

이 행렬을 구하는 방법은, 각 $\mathbf{b}_j$ 를 $\mathcal{B}'$ 의 선형 결합으로 표현하여 그 좌표 벡터를 $P$ 의 $j$ 번째 열로 놓는 것이다. 즉 $\mathbf{b}_j = \sum_i p_{ij} \mathbf{b}'_i$ 이면

$P_{\mathcal{B} \to \mathcal{B}'} = \begin{pmatrix} p_{11} & p_{12} & \cdots & p_{1n} \\ p_{21} & p_{22} & \cdots & p_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ p_{n1} & p_{n2} & \cdots & p_{nn} \end{pmatrix}$

이다. $P_{\mathcal{B} \to \mathcal{B}'}$ 는 가역이며, 역변환 행렬은 $P_{\mathcal{B}' \to \mathcal{B}} = P_{\mathcal{B} \to \mathcal{B}'}^{-1}$ 이다.

표준 기저 $\mathcal{E}$ 에서 기저 $\mathcal{B}$ 로의 변환에서, 기저 벡터 $\mathbf{b}_1, \ldots, \mathbf{b}_n$ 을 열로 나열한 행렬 $B = [\mathbf{b}_1 \; \mathbf{b}_2 \; \cdots \; \mathbf{b}_n]$ 에 대하여

$\mathbf{v} = B [\mathbf{v}]_\mathcal{B}, \quad [\mathbf{v}]_\mathcal{B} = B^{-1} \mathbf{v}$

가 성립한다.

4. 좌표 표현의 기하학적 의미

기저의 선택은 벡터 공간을 바라보는 관점(perspective)을 결정한다. 동일한 벡터라도 기저에 따라 좌표 표현이 달라지며, 적절한 기저를 선택하면 문제의 구조가 단순해질 수 있다.

예를 들어, $\mathbb{R}^2$ 에서 $\mathcal{B} = \left\{\begin{pmatrix}1\\1\end{pmatrix}, \begin{pmatrix}1\\-1\end{pmatrix}\right\}$ 을 기저로 선택하면, 벡터 $\mathbf{v} = \begin{pmatrix}3\\1\end{pmatrix}$ 의 좌표 벡터는

$[\mathbf{v}]_\mathcal{B} = B^{-1}\mathbf{v} = \frac{1}{2}\begin{pmatrix}1&1\\1&-1\end{pmatrix}\begin{pmatrix}3\\1\end{pmatrix} = \begin{pmatrix}2\\1\end{pmatrix}$

이 된다. 기저 변환은 좌표축의 회전, 신축, 반전 등의 기하학적 변환에 대응된다.

5. 딥러닝에서의 좌표 표현과 기저

원-핫 인코딩(one-hot encoding): 범주형 변수를 $\mathbb{R}^k$ 의 표준 기저 벡터로 표현하는 기법이다. $k$ 개의 범주 중 $i$ 번째 범주는 $\mathbf{e}_i \in \mathbb{R}^k$ 로 인코딩된다. 이 표현은 범주 간에 순서나 거리 관계를 부여하지 않는 점에서 범주형 데이터에 적합하다.

임베딩 행렬과 기저 변환: 임베딩 층(embedding layer)의 가중치 행렬 $E \in \mathbb{R}^{d \times k}$ 는 원-핫 벡터 $\mathbf{e}_i \in \mathbb{R}^k$ 를 임베딩 벡터 $\mathbf{x}_i = E\mathbf{e}_i \in \mathbb{R}^d$ 로 변환한다. 이 과정은 이산적인 표준 기저 표현을 연속적인 밀집(dense) 표현으로 변환하는 기저 변환으로 해석할 수 있다.

주성분 분석(PCA): 공분산 행렬의 고유벡터(eigenvector)를 새로운 기저로 선택하면, 데이터의 좌표 표현에서 각 성분이 비상관(uncorrelated)이 된다. 이는 데이터의 분산 구조를 가장 명확하게 드러내는 기저이며, 주성분(principal component)이라 부른다. 상위 $k$ 개의 주성분으로의 기저 변환은 차원 축소와 정보 보존을 동시에 달성한다.

정규 직교 기저의 계산적 이점: 정규 직교 기저(orthonormal basis) $\{\mathbf{q}_1, \ldots, \mathbf{q}_n\}$ 에서는 좌표 계산이 내적으로 단순화된다.

$[\mathbf{v}]_\mathcal{Q} = \begin{pmatrix}\langle\mathbf{v}, \mathbf{q}_1\rangle \\ \langle\mathbf{v}, \mathbf{q}_2\rangle \\ \vdots \\ \langle\mathbf{v}, \mathbf{q}_n\rangle\end{pmatrix} = Q^\top \mathbf{v}$

여기서 $Q = [\mathbf{q}_1 \; \cdots \; \mathbf{q}_n]$ 은 직교 행렬(orthogonal matrix)이며 $Q^{-1} = Q^\top$ 이다. 역행렬 계산이 전치로 대체되므로 수치적 안정성과 계산 효율성이 크게 향상된다. 이러한 이유로 그람-슈미트(Gram-Schmidt) 직교화, QR 분해 등은 수치 선형대수학의 핵심 알고리즘으로 널리 사용된다.