6.111 행렬 노름의 정의와 종류

1. 행렬 노름의 공리적 정의

행렬 노름(matrix norm)은 행렬의 “크기“를 측정하는 함수로, 벡터 노름의 자연스러운 확장이다.

정의 6.111.1 (행렬 노름). 함수 $\|\cdot\|: \mathbb{R}^{m \times n} \to \mathbb{R}$ 이 다음 네 조건을 만족하면 행렬 노름이라 한다.

(N1) 비음수성: $\|A\| \geq 0$ 이고, $\|A\| = 0 \iff A = \mathbf{0}$

(N2) 동차성: $\|\alpha A\| = |\alpha| \|A\|$ ( $\alpha \in \mathbb{R}$ )

(N3) 삼각 부등식: $\|A + B\| \leq \|A\| + \|B\|$

(N4) 부행렬 곱셈 조건(submultiplicativity): $\|AB\| \leq \|A\| \|B\|$ (정방 행렬인 경우)

조건 (N1)–(N3)은 벡터 노름과 동일하며, 조건 (N4)는 행렬 노름에 고유한 추가 조건이다. 부행렬 곱셈 조건은 행렬의 연쇄적 변환에서 오차의 전파를 분석하는 데 핵심적인 역할을 한다.

2. 유도 노름(연산자 노름)

행렬 노름 중 가장 중요한 부류는 벡터 노름으로부터 유도되는(induced) 노름이다.

정의 6.111.2 (유도 노름). 벡터 노름 $\|\cdot\|_p$ 에 대하여 유도되는 행렬 노름은 다음과 같이 정의된다.

$\|A\|_p = \sup_{\mathbf{x} \neq \mathbf{0}} \frac{\|A\mathbf{x}\|_p}{\|\mathbf{x}\|_p} = \sup_{\|\mathbf{x}\|_p = 1} \|A\mathbf{x}\|_p$

이 정의는 행렬 $A$ 가 단위 벡터에 작용할 때 출력 벡터의 최대 크기를 나타내며, 행렬을 선형 연산자(linear operator)로 간주했을 때의 연산자 노름(operator norm)에 해당한다.

정리 6.111.1. 유도 노름은 정의 6.111.1의 네 조건을 모두 만족한다. 특히, 단위 행렬의 유도 노름은 항상 $\|I\|_p = 1$ 이다.

주요 유도 노름

1-노름 (열 합 노름)

$\|A\|_1 = \max_{1 \leq j \leq n} \sum_{i=1}^{m} |a_{ij}|$

1-노름은 각 열의 절대값 합 중 최대값으로, 열 합 노름(column-sum norm)이라고도 한다. 계산이 매우 간단하며, $O(mn)$ 의 산술 연산으로 구할 수 있다.

2.1 무한대 노름 (행 합 노름)

$\|A\|_\infty = \max_{1 \leq i \leq m} \sum_{j=1}^{n} |a_{ij}|$

무한대 노름은 각 행의 절대값 합 중 최대값으로, 행 합 노름(row-sum norm)이라고도 한다. 1-노름과 마찬가지로 $O(mn)$ 의 비용으로 계산된다.

2-노름 (스펙트럼 노름)

$\|A\|_2 = \sigma_{\max}(A) = \sqrt{\lambda_{\max}(A^\top A)}$

여기서 $\sigma_{\max}(A)$ 는 $A$ 의 최대 특이값이고, $\lambda_{\max}(A^\top A)$ 는 $A^\top A$ 의 최대 고유값이다. 2-노름은 스펙트럼 노름(spectral norm)이라고도 하며, 행렬의 최대 신장 비율(maximum stretching ratio)을 나타낸다.

정리 6.111.2. 2-노름은 다음 성질을 만족한다.

(i) $\|A\|_2 = \|A^\top\|_2$

(ii) $\|A^\top A\|_2 = \|A\|_2^2$

(iii) 직교 행렬 $Q$ 에 대하여 $\|QA\|_2 = \|AQ\|_2 = \|A\|_2$ (단위 불변성)

(iv) $\|A\|_2 \leq \sqrt{\|A\|_1 \|A\|_\infty}$

2-노름의 계산은 특이값 분해(SVD)를 필요로 하므로, 1-노름이나 무한대 노름에 비해 계산 비용이 높다.

3. 주요 유도 노름의 비교

노름	정의	계산 비용	기하학적 의미
$\|A\|_1$	$\max_j \sum_i \vert a_{ij}\vert$	$O(mn)$	$\ell^1$ 단위구에서의 최대 신장
$\|A\|_2$	$\sigma_{\max}(A)$	$O(\min(mn^2, m^2n))$	$\ell^2$ 단위구에서의 최대 신장
$\|A\|_\infty$	$\max_i \sum_j \vert a_{ij}\vert$	$O(mn)$	$\ell^\infty$ 단위구에서의 최대 신장

4. 원소별 노름

유도 노름 외에도, 행렬의 원소에 직접 적용되는 노름이 있다.

4.1 프로베니우스 노름

정의 6.111.3 (프로베니우스 노름). 행렬 $A \in \mathbb{R}^{m \times n}$ 의 프로베니우스 노름(Frobenius norm)은 다음과 같이 정의된다.

$\|A\|_F = \sqrt{\sum_{i=1}^{m} \sum_{j=1}^{n} a_{ij}^2} = \sqrt{\text{tr}(A^\top A)} = \sqrt{\sum_{i=1}^{\min(m,n)} \sigma_i^2}$

여기서 $\sigma_i$ 는 $A$ 의 특이값이다. 프로베니우스 노름은 행렬을 $mn$ 차원 벡터로 간주했을 때의 유클리드 노름에 해당한다.

정리 6.111.3. 프로베니우스 노름은 다음 성질을 만족한다.

(i) 부행렬 곱셈 조건: $\|AB\|_F \leq \|A\|_F \|B\|_F$

(ii) 직교 불변성: 직교 행렬 $Q$ , $P$ 에 대하여 $\|QAP\|_F = \|A\|_F$

(iii) $\|A\|_2 \leq \|A\|_F \leq \sqrt{r} \|A\|_2$ (여기서 $r = \text{rank}(A)$ )

(iv) $\|A\|_F^2 = \|A\|_2^2$ 는 $\text{rank}(A) = 1$ 일 때만 성립

프로베니우스 노름은 유도 노름이 아니다. $\|I_n\|_F = \sqrt{n} \neq 1$ ( $n > 1$ )이므로 유도 노름의 조건을 만족하지 않는다.

핵 노름 (추적 노름)

정의 6.111.4 (핵 노름). 행렬 $A$ 의 핵 노름(nuclear norm, trace norm)은 특이값의 합으로 정의된다.

$\|A\|_* = \sum_{i=1}^{\min(m,n)} \sigma_i$

핵 노름은 행렬의 랭크에 대한 볼록 완화(convex relaxation)로 사용되며, 저랭크 행렬 복원(low-rank matrix recovery) 문제에서 핵심적으로 활용된다.

5. 노름 사이의 관계

행렬 $A \in \mathbb{R}^{m \times n}$ 에 대하여 다음의 부등식이 성립한다.

$\|A\|_2 \leq \|A\|_F \leq \sqrt{n} \|A\|_2$

$\|A\|_2 \leq \sqrt{\|A\|_1 \|A\|_\infty}$

$\frac{1}{\sqrt{n}} \|A\|_\infty \leq \|A\|_2 \leq \sqrt{m} \|A\|_\infty$

$\frac{1}{\sqrt{m}} \|A\|_1 \leq \|A\|_2 \leq \sqrt{n} \|A\|_1$

$\|A\|_\infty \leq n \|A\|_1, \quad \|A\|_1 \leq m \|A\|_\infty$

이러한 부등식은 계산이 용이한 노름으로부터 계산이 어려운 노름의 범위를 추정하는 데 활용된다.

행렬 노름의 쌍대성

$p$ -노름과 $q$ -노름이 $\frac{1}{p} + \frac{1}{q} = 1$ 을 만족할 때, 유도 $p$ -노름은 다음과 같은 쌍대 표현을 가진다.

$\|A\|_p = \sup_{\|\mathbf{x}\|_p \leq 1} \|A\mathbf{x}\|_p$

특히, 1-노름과 무한대 노름은 서로 쌍대(dual)이다.

$\|A\|_1 = \|A^\top\|_\infty, \quad \|A\|_\infty = \|A^\top\|_1$

로봇공학에서의 응용

자코비안의 크기 평가

자코비안 $J(\mathbf{q})$ 의 2-노름(스펙트럼 노름)은 관절 속도가 말단 장치 속도로 전달될 때의 최대 증폭 비율을 나타낸다.

$\|J\|_2 = \sigma_{\max}(J) = \max_{\|\dot{\mathbf{q}}\|_2 = 1} \|\dot{\mathbf{x}}\|_2$

이 값이 크면 특정 방향에서의 말단 장치 속도 생성 능력이 뛰어남을 의미하지만, 동시에 관절 오차가 크게 증폭될 수 있음을 나타내기도 한다.

5.1 오차 전파 분석

센서 잡음이나 관절 제어 오차가 말단 장치로 전파되는 크기는 행렬 노름으로 상한을 구할 수 있다. 관절 각도에 $\delta\mathbf{q}$ 의 오차가 있을 때,

$\|\delta\mathbf{x}\| = \|J \delta\mathbf{q}\| \leq \|J\|_2 \|\delta\mathbf{q}\|$

이 부등식은 관절 정밀도 요구 사항으로부터 말단 장치 정밀도를 추정하는 데 활용된다.

수치 안정성 평가

행렬 노름은 선형 시스템의 수치적 안정성을 평가하는 조건수의 정의에 핵심적으로 사용된다. 조건수는 $\kappa(A) = \|A\| \|A^{-1}\|$ 으로 정의되며, 이를 통해 역기구학 계산의 수치적 신뢰도를 판단할 수 있다.

프로베니우스 노름과 로봇 캘리브레이션

로봇 캘리브레이션에서 DH 파라미터의 오차 행렬 $\Delta A$ 의 크기를 프로베니우스 노름으로 측정하여 전체적인 기구학적 정확도를 평가한다. 프로베니우스 노름은 미분 가능하므로 최적화 문제의 비용 함수로 직접 활용될 수 있다.

수치 예제

다음 행렬의 주요 노름을 계산하자.

$A = \begin{bmatrix} 3 & -1 \\ 2 & 4 \\ -1 & 2 \end{bmatrix}$

1-노름:

$\|A\|_1 = \max(|3| + |2| + |-1|, \; |-1| + |4| + |2|) = \max(6, 7) = 7$

무한대 노름:

$\|A\|_\infty = \max(|3| + |-1|, \; |2| + |4|, \; |-1| + |2|) = \max(4, 6, 3) = 6$

프로베니우스 노름:

$\|A\|_F = \sqrt{9 + 1 + 4 + 16 + 1 + 4} = \sqrt{35} \approx 5.916$

2-노름: $A^\top A = \begin{bmatrix} 14 & 3 \\ 3 & 21 \end{bmatrix}$ 의 고유값을 구하면, 특성 방정식 $\lambda^2 - 35\lambda + 285 = 0$ 으로부터 $\lambda_1 \approx 23.37$ , $\lambda_2 \approx 11.63$ 이다. 따라서,

$\|A\|_2 = \sqrt{23.37} \approx 4.834$

부등식 $\|A\|_2 \leq \|A\|_F \leq \sqrt{2}\|A\|_2$ 를 확인하면, $4.834 \leq 5.916 \leq 6.835$ 이 성립한다.

참고문헌

Golub, G. H., & Van Loan, C. F. (2013). Matrix Computations (4th ed.). Johns Hopkins University Press.
Strang, G. (2023). Introduction to Linear Algebra (6th ed.). Wellesley-Cambridge Press.
Horn, R. A., & Johnson, C. R. (2013). Matrix Analysis (2nd ed.). Cambridge University Press.
Trefethen, L. N., & Bau, D. (1997). Numerical Linear Algebra. SIAM.

v 0.1