7.12 다변수 함수의 연쇄 법칙

다변수 함수의 연쇄 법칙(chain rule)은 합성 함수의 편도함수를 내부 함수의 편도함수들의 조합으로 표현하는 미분법의 핵심 정리이다. 로봇 공학에서 순기구학, 동역학, 센서 모델 등은 다수의 중간 변수를 거치는 합성 함수로 표현되며, 자코비안 행렬의 곱으로 귀결되는 연쇄 법칙은 이들의 미분적 분석에 필수적이다. 본 절에서는 다변수 연쇄 법칙의 엄밀한 정의와 다양한 형태, 그리고 로봇 공학적 응용을 다룬다.

1. 일변수 연쇄 법칙의 복습

일변수 합성 함수 $y = f(g(t))$ 에 대한 연쇄 법칙은 다음과 같다.

$\frac{dy}{dt} = \frac{df}{dg} \cdot \frac{dg}{dt}$

이를 다변수로 확장하면 편도함수와 자코비안 행렬의 곱으로 일반화된다.

2. 다변수 연쇄 법칙의 일반 형태

$\mathbf{x} \in \mathbb{R}^n$ 가 $\mathbf{u} \in \mathbb{R}^m$ 의 함수이고, $\mathbf{u}$ 가 $\mathbf{t} \in \mathbb{R}^p$ 의 함수인 합성 사상을 고려하자.

$\mathbf{x} = \mathbf{f}(\mathbf{u}), \quad \mathbf{u} = \mathbf{g}(\mathbf{t})$

합성 함수 $\mathbf{h}(\mathbf{t}) = \mathbf{f}(\mathbf{g}(\mathbf{t}))$ 의 자코비안은 다음과 같다.

$J_{\mathbf{h}}(\mathbf{t}) = J_{\mathbf{f}}(\mathbf{u}) \cdot J_{\mathbf{g}}(\mathbf{t})$

여기서 $J_{\mathbf{f}} \in \mathbb{R}^{n \times m}$ , $J_{\mathbf{g}} \in \mathbb{R}^{m \times p}$ 이므로 $J_{\mathbf{h}} \in \mathbb{R}^{n \times p}$ 이다. 성분별로 표현하면 다음과 같다.

$\frac{\partial h_i}{\partial t_k} = \sum_{j=1}^{m} \frac{\partial f_i}{\partial u_j} \cdot \frac{\partial g_j}{\partial t_k}$

3. 경우별 연쇄 법칙

3.1 경우 1: $z = f(x, y)$ , $x = x(t)$ , $y = y(t)$

단일 매개변수 $t$ 에 대해 $z$ 의 전미분은 다음과 같다.

$\frac{dz}{dt} = \frac{\partial f}{\partial x}\frac{dx}{dt} + \frac{\partial f}{\partial y}\frac{dy}{dt}$

3.2 경우 2: $z = f(x, y)$ , $x = x(s, t)$ , $y = y(s, t)$

두 매개변수 $(s, t)$ 에 대한 편도함수는 다음과 같다.

$\frac{\partial z}{\partial s} = \frac{\partial f}{\partial x}\frac{\partial x}{\partial s} + \frac{\partial f}{\partial y}\frac{\partial y}{\partial s}$

$\frac{\partial z}{\partial t} = \frac{\partial f}{\partial x}\frac{\partial x}{\partial t} + \frac{\partial f}{\partial y}\frac{\partial y}{\partial t}$

이를 행렬 형식으로 표현하면 다음과 같다.

$\begin{bmatrix} \dfrac{\partial z}{\partial s} & \dfrac{\partial z}{\partial t} \end{bmatrix} = \begin{bmatrix} \dfrac{\partial f}{\partial x} & \dfrac{\partial f}{\partial y} \end{bmatrix} \begin{bmatrix} \dfrac{\partial x}{\partial s} & \dfrac{\partial x}{\partial t} \\[6pt] \dfrac{\partial y}{\partial s} & \dfrac{\partial y}{\partial t} \end{bmatrix}$

3.3 경우 3: 일부 변수가 직접 의존

$z = f(x, y, t)$ 이고 $x = x(t)$ , $y = y(t)$ 인 경우, $t$ 에 대한 전도함수는 다음과 같다.

$\frac{dz}{dt} = \frac{\partial f}{\partial x}\frac{dx}{dt} + \frac{\partial f}{\partial y}\frac{dy}{dt} + \frac{\partial f}{\partial t}$

마지막 항은 $f$ 가 $t$ 에 직접(명시적으로) 의존하는 기여이다.

4. 자코비안 행렬의 연쇄 법칙

벡터값 합성 함수 $\mathbf{h} = \mathbf{f} \circ \mathbf{g}$ 의 자코비안이 개별 자코비안의 곱으로 표현되는 것은 연쇄 법칙의 행렬 형식이다. 세 단계 이상의 합성에도 확장된다.

$\mathbf{y} = \mathbf{f}_1(\mathbf{f}_2(\cdots \mathbf{f}_k(\mathbf{x})\cdots))$

$J_{\mathbf{y}} = J_{\mathbf{f}_1} \cdot J_{\mathbf{f}_2} \cdots J_{\mathbf{f}_k}$

각 자코비안은 해당 함수의 입력값에서 평가된다. 이 행렬 곱의 순서는 함수 합성의 역순이다.

5. 존재 조건과 증명의 핵심

다변수 연쇄 법칙의 엄밀한 성립 조건은 다음과 같다.

$\mathbf{g}$ 가 점 $\mathbf{t}_0$ 에서 미분 가능(전미분 가능)하다.
$\mathbf{f}$ 가 점 $\mathbf{u}_0 = \mathbf{g}(\mathbf{t}_0)$ 에서 미분 가능하다.

편도함수의 존재만으로는 부족하며, 전미분 가능성(Fréchet 미분 가능성)이 필요하다. 증명의 핵심은 전미분의 선형 근사 성질을 이용하는 것이다.

$\mathbf{f}(\mathbf{u}_0 + \Delta\mathbf{u}) = \mathbf{f}(\mathbf{u}_0) + J_{\mathbf{f}}(\mathbf{u}_0)\Delta\mathbf{u} + o(\|\Delta\mathbf{u}\|)$

$\mathbf{g}(\mathbf{t}_0 + \Delta\mathbf{t}) = \mathbf{g}(\mathbf{t}_0) + J_{\mathbf{g}}(\mathbf{t}_0)\Delta\mathbf{t} + o(\|\Delta\mathbf{t}\|)$

두 식을 결합하면 $\Delta\mathbf{u} = J_{\mathbf{g}}\Delta\mathbf{t} + o(\|\Delta\mathbf{t}\|)$ 를 대입하여 다음을 얻는다.

$\mathbf{h}(\mathbf{t}_0 + \Delta\mathbf{t}) = \mathbf{h}(\mathbf{t}_0) + J_{\mathbf{f}} J_{\mathbf{g}} \Delta\mathbf{t} + o(\|\Delta\mathbf{t}\|)$

6. 로봇 순기구학에서의 연쇄 법칙

직렬 매니퓰레이터의 순기구학은 각 관절 변환의 합성으로 표현된다. $n$ 개 관절의 동차 변환 행렬이 다음과 같이 연쇄적으로 구성될 때,

$T_n^0(\mathbf{q}) = T_1^0(q_1) \cdot T_2^1(q_2) \cdots T_n^{n-1}(q_n)$

말단 장치의 위치를 관절 변수로 미분하면 연쇄 법칙에 의해 자코비안이 유도된다. 각 관절 $i$ 에 대한 편미분은 다음의 구조를 가진다.

$\frac{\partial T_n^0}{\partial q_i} = T_1^0 \cdots T_{i-1}^{i-2} \frac{\partial T_i^{i-1}}{\partial q_i} T_{i+1}^i \cdots T_n^{n-1}$

7. 동역학에서의 연쇄 법칙

라그랑주 동역학에서 운동 에너지 $K(\mathbf{q}, \dot{\mathbf{q}})$ 의 시간 미분은 연쇄 법칙을 통해 다음과 같이 전개된다.

$\frac{d}{dt}\frac{\partial K}{\partial \dot{q}_i} = \sum_{j=1}^{n} \frac{\partial^2 K}{\partial q_j \partial \dot{q}_i} \dot{q}_j + \sum_{j=1}^{n} \frac{\partial^2 K}{\partial \dot{q}_j \partial \dot{q}_i} \ddot{q}_j$

이 전개에서 연쇄 법칙은 관성 행렬의 시간 미분과 코리올리-구심력 항의 유도에 핵심적으로 사용된다.

8. 역전파 알고리즘과의 관계

인공 신경망의 역전파(backpropagation) 알고리즘은 다변수 연쇄 법칙의 반복 적용에 해당한다. 손실 함수 $L$ 의 가중치 $w$ 에 대한 경사는 중간 활성화 변수들을 경유하여 연쇄적으로 계산된다.

$\frac{\partial L}{\partial w} = \frac{\partial L}{\partial y_L} \cdot \frac{\partial y_L}{\partial y_{L-1}} \cdots \frac{\partial y_2}{\partial y_1} \cdot \frac{\partial y_1}{\partial w}$

이는 자코비안 행렬의 연쇄 곱에 해당하며, 로봇 학습 기반 제어에서 정책 경사(policy gradient) 계산에 활용된다.

9. 시간 미분에서의 연쇄 법칙

시간에 의존하는 벡터 함수 $\mathbf{x}(t) = \mathbf{f}(\mathbf{q}(t))$ 의 시간 미분은 다음과 같다.

$\dot{\mathbf{x}} = J_{\mathbf{f}}(\mathbf{q}) \dot{\mathbf{q}}$

이를 한 번 더 미분하면 가속도 관계를 얻는다.

$\ddot{\mathbf{x}} = J_{\mathbf{f}} \ddot{\mathbf{q}} + \dot{J}_{\mathbf{f}} \dot{\mathbf{q}}$

여기서 $\dot{J}_{\mathbf{f}}$ 의 계산에도 연쇄 법칙이 재귀적으로 적용된다.

$\dot{J}_{\mathbf{f}} = \sum_{k=1}^{n} \frac{\partial J_{\mathbf{f}}}{\partial q_k} \dot{q}_k$

10. 참고 문헌

Marsden, J. E., & Tromba, A. J. (2012). Vector Calculus. 6th ed. W. H. Freeman.
Spivak, M. (1965). Calculus on Manifolds. Addison-Wesley.
Siciliano, B., Sciavicco, L., Villani, L., & Oriolo, G. (2009). Robotics: Modelling, Planning and Control. Springer.
Craig, J. J. (2005). Introduction to Robotics: Mechanics and Control. 3rd ed. Pearson Prentice Hall.
Murray, R. M., Li, Z., & Sastry, S. S. (1994). A Mathematical Introduction to Robotic Manipulation. CRC Press.

v 0.1