6.111 행렬 노름의 정의와 종류

1. 행렬 노름의 공리적 정의

행렬 노름(matrix norm)은 행렬의 “크기“를 측정하는 함수로, 벡터 노름의 자연스러운 확장이다.

정의 6.111.1 (행렬 노름). 함수 \|\cdot\|: \mathbb{R}^{m \times n} \to \mathbb{R}이 다음 네 조건을 만족하면 행렬 노름이라 한다.

(N1) 비음수성: \|A\| \geq 0이고, \|A\| = 0 \iff A = \mathbf{0}

(N2) 동차성: \|\alpha A\| = |\alpha| \|A\| (\alpha \in \mathbb{R})

(N3) 삼각 부등식: \|A + B\| \leq \|A\| + \|B\|

(N4) 부행렬 곱셈 조건(submultiplicativity): \|AB\| \leq \|A\| \|B\| (정방 행렬인 경우)

조건 (N1)–(N3)은 벡터 노름과 동일하며, 조건 (N4)는 행렬 노름에 고유한 추가 조건이다. 부행렬 곱셈 조건은 행렬의 연쇄적 변환에서 오차의 전파를 분석하는 데 핵심적인 역할을 한다.

2. 유도 노름(연산자 노름)

행렬 노름 중 가장 중요한 부류는 벡터 노름으로부터 유도되는(induced) 노름이다.

정의 6.111.2 (유도 노름). 벡터 노름 \|\cdot\|_p에 대하여 유도되는 행렬 노름은 다음과 같이 정의된다.

\|A\|_p = \sup_{\mathbf{x} \neq \mathbf{0}} \frac{\|A\mathbf{x}\|_p}{\|\mathbf{x}\|_p} = \sup_{\|\mathbf{x}\|_p = 1} \|A\mathbf{x}\|_p

이 정의는 행렬 A가 단위 벡터에 작용할 때 출력 벡터의 최대 크기를 나타내며, 행렬을 선형 연산자(linear operator)로 간주했을 때의 연산자 노름(operator norm)에 해당한다.

정리 6.111.1. 유도 노름은 정의 6.111.1의 네 조건을 모두 만족한다. 특히, 단위 행렬의 유도 노름은 항상 \|I\|_p = 1이다.

주요 유도 노름

1-노름 (열 합 노름)

\|A\|_1 = \max_{1 \leq j \leq n} \sum_{i=1}^{m} |a_{ij}|

1-노름은 각 열의 절대값 합 중 최대값으로, 열 합 노름(column-sum norm)이라고도 한다. 계산이 매우 간단하며, O(mn)의 산술 연산으로 구할 수 있다.

2.1 무한대 노름 (행 합 노름)

\|A\|_\infty = \max_{1 \leq i \leq m} \sum_{j=1}^{n} |a_{ij}|

무한대 노름은 각 행의 절대값 합 중 최대값으로, 행 합 노름(row-sum norm)이라고도 한다. 1-노름과 마찬가지로 O(mn)의 비용으로 계산된다.

2-노름 (스펙트럼 노름)

\|A\|_2 = \sigma_{\max}(A) = \sqrt{\lambda_{\max}(A^\top A)}

여기서 \sigma_{\max}(A)A의 최대 특이값이고, \lambda_{\max}(A^\top A)A^\top A의 최대 고유값이다. 2-노름은 스펙트럼 노름(spectral norm)이라고도 하며, 행렬의 최대 신장 비율(maximum stretching ratio)을 나타낸다.

정리 6.111.2. 2-노름은 다음 성질을 만족한다.

(i) \|A\|_2 = \|A^\top\|_2

(ii) \|A^\top A\|_2 = \|A\|_2^2

(iii) 직교 행렬 Q에 대하여 \|QA\|_2 = \|AQ\|_2 = \|A\|_2 (단위 불변성)

(iv) \|A\|_2 \leq \sqrt{\|A\|_1 \|A\|_\infty}

2-노름의 계산은 특이값 분해(SVD)를 필요로 하므로, 1-노름이나 무한대 노름에 비해 계산 비용이 높다.

3. 주요 유도 노름의 비교

노름정의계산 비용기하학적 의미
|A|_1\max_j \sum_i \vert a_{ij}\vertO(mn)\ell^1 단위구에서의 최대 신장
|A|_2\sigma_{\max}(A)O(\min(mn^2, m^2n))\ell^2 단위구에서의 최대 신장
|A|_\infty\max_i \sum_j \vert a_{ij}\vertO(mn)\ell^\infty 단위구에서의 최대 신장

4. 원소별 노름

유도 노름 외에도, 행렬의 원소에 직접 적용되는 노름이 있다.

4.1 프로베니우스 노름

정의 6.111.3 (프로베니우스 노름). 행렬 A \in \mathbb{R}^{m \times n}의 프로베니우스 노름(Frobenius norm)은 다음과 같이 정의된다.

\|A\|_F = \sqrt{\sum_{i=1}^{m} \sum_{j=1}^{n} a_{ij}^2} = \sqrt{\text{tr}(A^\top A)} = \sqrt{\sum_{i=1}^{\min(m,n)} \sigma_i^2}

여기서 \sigma_iA의 특이값이다. 프로베니우스 노름은 행렬을 mn차원 벡터로 간주했을 때의 유클리드 노름에 해당한다.

정리 6.111.3. 프로베니우스 노름은 다음 성질을 만족한다.

(i) 부행렬 곱셈 조건: \|AB\|_F \leq \|A\|_F \|B\|_F

(ii) 직교 불변성: 직교 행렬 Q, P에 대하여 \|QAP\|_F = \|A\|_F

(iii) \|A\|_2 \leq \|A\|_F \leq \sqrt{r} \|A\|_2 (여기서 r = \text{rank}(A))

(iv) \|A\|_F^2 = \|A\|_2^2\text{rank}(A) = 1일 때만 성립

프로베니우스 노름은 유도 노름이 아니다. \|I_n\|_F = \sqrt{n} \neq 1 (n > 1)이므로 유도 노름의 조건을 만족하지 않는다.

핵 노름 (추적 노름)

정의 6.111.4 (핵 노름). 행렬 A의 핵 노름(nuclear norm, trace norm)은 특이값의 합으로 정의된다.

\|A\|_* = \sum_{i=1}^{\min(m,n)} \sigma_i

핵 노름은 행렬의 랭크에 대한 볼록 완화(convex relaxation)로 사용되며, 저랭크 행렬 복원(low-rank matrix recovery) 문제에서 핵심적으로 활용된다.

5. 노름 사이의 관계

행렬 A \in \mathbb{R}^{m \times n}에 대하여 다음의 부등식이 성립한다.

\|A\|_2 \leq \|A\|_F \leq \sqrt{n} \|A\|_2

\|A\|_2 \leq \sqrt{\|A\|_1 \|A\|_\infty}

\frac{1}{\sqrt{n}} \|A\|_\infty \leq \|A\|_2 \leq \sqrt{m} \|A\|_\infty

\frac{1}{\sqrt{m}} \|A\|_1 \leq \|A\|_2 \leq \sqrt{n} \|A\|_1

\|A\|_\infty \leq n \|A\|_1, \quad \|A\|_1 \leq m \|A\|_\infty

이러한 부등식은 계산이 용이한 노름으로부터 계산이 어려운 노름의 범위를 추정하는 데 활용된다.

행렬 노름의 쌍대성

p-노름과 q-노름이 \frac{1}{p} + \frac{1}{q} = 1을 만족할 때, 유도 p-노름은 다음과 같은 쌍대 표현을 가진다.

\|A\|_p = \sup_{\|\mathbf{x}\|_p \leq 1} \|A\mathbf{x}\|_p

특히, 1-노름과 무한대 노름은 서로 쌍대(dual)이다.

\|A\|_1 = \|A^\top\|_\infty, \quad \|A\|_\infty = \|A^\top\|_1

로봇공학에서의 응용

자코비안의 크기 평가

자코비안 J(\mathbf{q})의 2-노름(스펙트럼 노름)은 관절 속도가 말단 장치 속도로 전달될 때의 최대 증폭 비율을 나타낸다.

\|J\|_2 = \sigma_{\max}(J) = \max_{\|\dot{\mathbf{q}}\|_2 = 1} \|\dot{\mathbf{x}}\|_2

이 값이 크면 특정 방향에서의 말단 장치 속도 생성 능력이 뛰어남을 의미하지만, 동시에 관절 오차가 크게 증폭될 수 있음을 나타내기도 한다.

5.1 오차 전파 분석

센서 잡음이나 관절 제어 오차가 말단 장치로 전파되는 크기는 행렬 노름으로 상한을 구할 수 있다. 관절 각도에 \delta\mathbf{q}의 오차가 있을 때,

\|\delta\mathbf{x}\| = \|J \delta\mathbf{q}\| \leq \|J\|_2 \|\delta\mathbf{q}\|

이 부등식은 관절 정밀도 요구 사항으로부터 말단 장치 정밀도를 추정하는 데 활용된다.

수치 안정성 평가

행렬 노름은 선형 시스템의 수치적 안정성을 평가하는 조건수의 정의에 핵심적으로 사용된다. 조건수는 \kappa(A) = \|A\| \|A^{-1}\|으로 정의되며, 이를 통해 역기구학 계산의 수치적 신뢰도를 판단할 수 있다.

프로베니우스 노름과 로봇 캘리브레이션

로봇 캘리브레이션에서 DH 파라미터의 오차 행렬 \Delta A의 크기를 프로베니우스 노름으로 측정하여 전체적인 기구학적 정확도를 평가한다. 프로베니우스 노름은 미분 가능하므로 최적화 문제의 비용 함수로 직접 활용될 수 있다.

수치 예제

다음 행렬의 주요 노름을 계산하자.

A = \begin{bmatrix} 3 & -1 \\ 2 & 4 \\ -1 & 2 \end{bmatrix}

1-노름:

\|A\|_1 = \max(|3| + |2| + |-1|, \; |-1| + |4| + |2|) = \max(6, 7) = 7

무한대 노름:

\|A\|_\infty = \max(|3| + |-1|, \; |2| + |4|, \; |-1| + |2|) = \max(4, 6, 3) = 6

프로베니우스 노름:

\|A\|_F = \sqrt{9 + 1 + 4 + 16 + 1 + 4} = \sqrt{35} \approx 5.916

2-노름: A^\top A = \begin{bmatrix} 14 & 3 \\ 3 & 21 \end{bmatrix}의 고유값을 구하면, 특성 방정식 \lambda^2 - 35\lambda + 285 = 0으로부터 \lambda_1 \approx 23.37, \lambda_2 \approx 11.63이다. 따라서,

\|A\|_2 = \sqrt{23.37} \approx 4.834

부등식 \|A\|_2 \leq \|A\|_F \leq \sqrt{2}\|A\|_2를 확인하면, 4.834 \leq 5.916 \leq 6.835이 성립한다.


참고문헌

  • Golub, G. H., & Van Loan, C. F. (2013). Matrix Computations (4th ed.). Johns Hopkins University Press.
  • Strang, G. (2023). Introduction to Linear Algebra (6th ed.). Wellesley-Cambridge Press.
  • Horn, R. A., & Johnson, C. R. (2013). Matrix Analysis (2nd ed.). Cambridge University Press.
  • Trefethen, L. N., & Bau, D. (1997). Numerical Linear Algebra. SIAM.

v 0.1