27.10 정규 기저(Standard Basis)와 좌표 표현 체계

1. 정규 기저의 정의

\mathbb{R}^n의 정규 기저(standard basis) 또는 표준 기저는 n개의 단위 벡터 \mathcal{E} = \{\mathbf{e}_1, \mathbf{e}_2, \ldots, \mathbf{e}_n\}으로 구성된다. 여기서 \mathbf{e}_i는 크로네커 델타(Kronecker delta)를 이용하여 다음과 같이 정의된다.

(\mathbf{e}_i)_j = \delta_{ij} = \begin{cases} 1 & \text{if } i = j \\ 0 & \text{if } i \neq j \end{cases}

\mathbf{e}_ii번째 성분만 1이고 나머지 성분은 모두 0이다. 표준 기저가 실제로 \mathbb{R}^n의 기저임을 확인하려면 두 가지를 보여야 한다.

선형 독립: \sum_{i=1}^n \alpha_i \mathbf{e}_i = \mathbf{0}이면, 좌변의 j번째 성분이 \alpha_j이므로 모든 \alpha_j = 0이다.

생성: 임의의 \mathbf{v} = (v_1, v_2, \ldots, v_n)^\top \in \mathbb{R}^n에 대하여 \mathbf{v} = \sum_{i=1}^n v_i \mathbf{e}_i가 성립한다.

표준 기저는 추가적으로 정규 직교성(orthonormality)을 만족한다.

\langle \mathbf{e}_i, \mathbf{e}_j \rangle = \delta_{ij}

이는 서로 다른 기저 벡터가 직교(orthogonal)하며 각 기저 벡터의 노름이 1임을 의미한다.

2. 좌표 표현 체계

순서 기저(ordered basis) \mathcal{B} = (\mathbf{b}_1, \mathbf{b}_2, \ldots, \mathbf{b}_n)이 주어진 벡터 공간 V에서, 임의의 \mathbf{v} \in V는 유일한 선형 결합

\mathbf{v} = \alpha_1 \mathbf{b}_1 + \alpha_2 \mathbf{b}_2 + \cdots + \alpha_n \mathbf{b}_n

으로 표현된다. 이때의 계수 (\alpha_1, \alpha_2, \ldots, \alpha_n)^\top을 기저 \mathcal{B}에 대한 \mathbf{v}의 좌표 벡터(coordinate vector)라 하며, [\mathbf{v}]_\mathcal{B}로 표기한다.

좌표 사상(coordinate map) \phi_\mathcal{B}: V \to \mathbb{R}^n\phi_\mathcal{B}(\mathbf{v}) = [\mathbf{v}]_\mathcal{B}로 정의되며, 이 사상은 선형이고 전단사(bijective)이다. 따라서 좌표 사상은 벡터 공간 동형 사상(isomorphism)이며, n차원 벡터 공간은 모두 \mathbb{R}^n과 동형이다.

표준 기저 \mathcal{E}에 대한 좌표 벡터는 벡터 자체와 일치한다.

[\mathbf{v}]_\mathcal{E} = \mathbf{v}

이 성질 때문에 \mathbb{R}^n에서 작업할 때에는 좌표 벡터와 벡터를 별도로 구분하지 않는 경우가 많다.

3. 기저 변환 행렬

두 기저 \mathcal{B} = (\mathbf{b}_1, \ldots, \mathbf{b}_n)\mathcal{B}' = (\mathbf{b}'_1, \ldots, \mathbf{b}'_n)이 주어졌을 때, 기저 변환 행렬(change of basis matrix) P_{\mathcal{B} \to \mathcal{B}'}는 다음 관계를 만족한다.

[\mathbf{v}]_{\mathcal{B}'} = P_{\mathcal{B} \to \mathcal{B}'} [\mathbf{v}]_\mathcal{B}

이 행렬을 구하는 방법은, 각 \mathbf{b}_j\mathcal{B}'의 선형 결합으로 표현하여 그 좌표 벡터를 Pj번째 열로 놓는 것이다. 즉 \mathbf{b}_j = \sum_i p_{ij} \mathbf{b}'_i이면

P_{\mathcal{B} \to \mathcal{B}'} = \begin{pmatrix} p_{11} & p_{12} & \cdots & p_{1n} \\ p_{21} & p_{22} & \cdots & p_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ p_{n1} & p_{n2} & \cdots & p_{nn} \end{pmatrix}

이다. P_{\mathcal{B} \to \mathcal{B}'}는 가역이며, 역변환 행렬은 P_{\mathcal{B}' \to \mathcal{B}} = P_{\mathcal{B} \to \mathcal{B}'}^{-1}이다.

표준 기저 \mathcal{E}에서 기저 \mathcal{B}로의 변환에서, 기저 벡터 \mathbf{b}_1, \ldots, \mathbf{b}_n을 열로 나열한 행렬 B = [\mathbf{b}_1 \; \mathbf{b}_2 \; \cdots \; \mathbf{b}_n]에 대하여

\mathbf{v} = B [\mathbf{v}]_\mathcal{B}, \quad [\mathbf{v}]_\mathcal{B} = B^{-1} \mathbf{v}

가 성립한다.

4. 좌표 표현의 기하학적 의미

기저의 선택은 벡터 공간을 바라보는 관점(perspective)을 결정한다. 동일한 벡터라도 기저에 따라 좌표 표현이 달라지며, 적절한 기저를 선택하면 문제의 구조가 단순해질 수 있다.

예를 들어, \mathbb{R}^2에서 \mathcal{B} = \left\{\begin{pmatrix}1\\1\end{pmatrix}, \begin{pmatrix}1\\-1\end{pmatrix}\right\}을 기저로 선택하면, 벡터 \mathbf{v} = \begin{pmatrix}3\\1\end{pmatrix}의 좌표 벡터는

[\mathbf{v}]_\mathcal{B} = B^{-1}\mathbf{v} = \frac{1}{2}\begin{pmatrix}1&1\\1&-1\end{pmatrix}\begin{pmatrix}3\\1\end{pmatrix} = \begin{pmatrix}2\\1\end{pmatrix}

이 된다. 기저 변환은 좌표축의 회전, 신축, 반전 등의 기하학적 변환에 대응된다.

5. 딥러닝에서의 좌표 표현과 기저

원-핫 인코딩(one-hot encoding): 범주형 변수를 \mathbb{R}^k의 표준 기저 벡터로 표현하는 기법이다. k개의 범주 중 i번째 범주는 \mathbf{e}_i \in \mathbb{R}^k로 인코딩된다. 이 표현은 범주 간에 순서나 거리 관계를 부여하지 않는 점에서 범주형 데이터에 적합하다.

임베딩 행렬과 기저 변환: 임베딩 층(embedding layer)의 가중치 행렬 E \in \mathbb{R}^{d \times k}는 원-핫 벡터 \mathbf{e}_i \in \mathbb{R}^k를 임베딩 벡터 \mathbf{x}_i = E\mathbf{e}_i \in \mathbb{R}^d로 변환한다. 이 과정은 이산적인 표준 기저 표현을 연속적인 밀집(dense) 표현으로 변환하는 기저 변환으로 해석할 수 있다.

주성분 분석(PCA): 공분산 행렬의 고유벡터(eigenvector)를 새로운 기저로 선택하면, 데이터의 좌표 표현에서 각 성분이 비상관(uncorrelated)이 된다. 이는 데이터의 분산 구조를 가장 명확하게 드러내는 기저이며, 주성분(principal component)이라 부른다. 상위 k개의 주성분으로의 기저 변환은 차원 축소와 정보 보존을 동시에 달성한다.

정규 직교 기저의 계산적 이점: 정규 직교 기저(orthonormal basis) \{\mathbf{q}_1, \ldots, \mathbf{q}_n\}에서는 좌표 계산이 내적으로 단순화된다.

[\mathbf{v}]_\mathcal{Q} = \begin{pmatrix}\langle\mathbf{v}, \mathbf{q}_1\rangle \\ \langle\mathbf{v}, \mathbf{q}_2\rangle \\ \vdots \\ \langle\mathbf{v}, \mathbf{q}_n\rangle\end{pmatrix} = Q^\top \mathbf{v}

여기서 Q = [\mathbf{q}_1 \; \cdots \; \mathbf{q}_n]은 직교 행렬(orthogonal matrix)이며 Q^{-1} = Q^\top이다. 역행렬 계산이 전치로 대체되므로 수치적 안정성과 계산 효율성이 크게 향상된다. 이러한 이유로 그람-슈미트(Gram-Schmidt) 직교화, QR 분해 등은 수치 선형대수학의 핵심 알고리즘으로 널리 사용된다.