7.144 간접법과 사격법

1. 간접법의 원리

간접법(indirect method)은 최적 제어 문제에 변분법 또는 폰트랴긴의 최대 원리를 적용하여 최적성의 필요 조건을 먼저 유도하고, 이 조건을 만족하는 해를 수치적으로 구하는 방법이다. “먼저 최적화하고 그 다음 이산화”(optimize-then-discretize)하는 접근법이다.

최대 원리로부터 도출되는 상태-공상태 시스템은 다음의 두 점 경계값 문제(Two-Point Boundary Value Problem, TPBVP)를 구성한다.

$\dot{\mathbf{x}}^* = \frac{\partial H}{\partial \boldsymbol{\lambda}}, \quad \mathbf{x}^*(t_0) = \mathbf{x}_0$

$\dot{\boldsymbol{\lambda}}^* = -\frac{\partial H}{\partial \mathbf{x}}, \quad \boldsymbol{\lambda}^*(t_f) = \frac{\partial \phi}{\partial \mathbf{x}}\bigg\vert_{\mathbf{x}^*(t_f)}$

상태의 초기 조건과 공상태의 종단 조건이 서로 다른 시각에 부여되므로, 초기값 문제로 직접 풀 수 없다.

2. 단일 사격법(Single Shooting)

2.1 알고리즘

공상태의 초기값 $\boldsymbol{\lambda}_0$ 를 추정하고, 상태-공상태 시스템을 초기 시각 $t_0$ 에서 종단 시각 $t_f$ 까지 순방향으로 적분한다. 종단 조건의 잔차를 계산하여 $\boldsymbol{\lambda}_0$ 를 갱신한다.

$\mathbf{r}(\boldsymbol{\lambda}_0) = \boldsymbol{\lambda}(t_f; \boldsymbol{\lambda}_0) - \frac{\partial \phi}{\partial \mathbf{x}}\bigg\vert_{\mathbf{x}(t_f; \boldsymbol{\lambda}_0)}$

이 잔차를 영으로 만드는 $\boldsymbol{\lambda}_0$ 를 뉴턴법으로 구한다.

$\frac{\partial \mathbf{r}}{\partial \boldsymbol{\lambda}_0}\Delta\boldsymbol{\lambda}_0 = -\mathbf{r}(\boldsymbol{\lambda}_0^{(k)})$

감도 행렬 $\frac{\partial \mathbf{r}}{\partial \boldsymbol{\lambda}_0}$ 는 변분 방정식(variational equation)의 적분으로 계산된다.

2.2 수치적 어려움

상태-공상태 시스템은 본질적으로 불안정한 구조를 갖는다. 상태 방정식의 안정 모드가 공상태 방정식에서는 불안정 모드가 되므로, 공상태의 초기값의 미소한 오차가 지수적으로 증폭된다. 이는 단일 사격법의 가장 심각한 한계로, 긴 시간 지평이나 불안정 시스템에서 수치적으로 사실상 풀 수 없는 경우가 발생한다.

3. 다중 사격법(Multiple Shooting)

3.1 원리

시간 구간을 $M$ 개의 하위 구간으로 분할하고, 각 하위 구간의 초기 상태와 공상태를 독립 변수로 도입한다. 각 구간에서 독립적으로 적분하고, 구간 경계에서의 연속성 조건(matching condition)을 등식 제약으로 부과한다.

$\begin{bmatrix} \mathbf{x}(t_j^+; \mathbf{x}_j, \boldsymbol{\lambda}_j) \\ \boldsymbol{\lambda}(t_j^+; \mathbf{x}_j, \boldsymbol{\lambda}_j) \end{bmatrix} - \begin{bmatrix} \mathbf{x}_{j+1} \\ \boldsymbol{\lambda}_{j+1} \end{bmatrix} = \mathbf{0}, \quad j = 0, \ldots, M-1$

결정 변수: $[\mathbf{x}_0, \boldsymbol{\lambda}_0, \mathbf{x}_1, \boldsymbol{\lambda}_1, \ldots, \mathbf{x}_M, \boldsymbol{\lambda}_M]$

3.2 이점

각 하위 구간의 적분 길이가 전체 구간의 $1/M$ 로 짧아져, 불안정 모드의 성장이 억제된다. 초기 추정이 부정확해도 구간별 연속성 제약에 의해 안정적인 해법이 가능하다. 또한 각 구간의 적분이 독립적이므로 병렬 처리가 가능하다.

4. 배치법에 의한 경계값 문제 해법

TPBVP를 배치법(collocation method)으로 직접 풀 수도 있다. 상태와 공상태를 다항식으로 근사하고, 상태-공상태 미분 방정식이 배치점에서 만족되도록 대수적 등식 시스템을 구성한다. MATLAB의 bvp4c, bvp5c 등이 이 접근법의 구현이다.

5. 간접법과 직접법의 비교

특성	간접법	직접법
접근 방식	최적화 후 이산화	이산화 후 최적화
최적 조건	정확히 만족 (이론적)	NLP의 KKT 조건 만족
부등식 제약 처리	전환 시각 결정 필요	NLP 제약으로 직접 처리
초기 추정	공상태 초기값 (비직관적)	상태/제어 궤적 (직관적)
수치 안정성	불안정 모드에 취약	양호 (특히 배치법)
해의 정밀도	이론적으로 우수	이산화 오차에 의존
구현 난이도	높음	상대적으로 낮음
실용적 선호	항공우주 분야 일부	로봇 공학에서 주류

6. 간접법의 장점

간접법은 최적성 조건을 정확히 만족하는 해를 제공하며, 특이 호(singular arc)의 정확한 처리가 가능하다. 또한 공상태 변수의 물리적 해석(민감도, 한계 가치)이 자연스럽게 제공된다. 시간 최적 제어에서 뱅뱅 전환 시각의 정밀한 결정에 간접법이 유리하다.

7. 로봇 공학에서의 위상

로봇 공학에서는 직접법이 주류이지만, 간접법은 다음의 경우에 가치가 있다.

벤치마크 해의 생성: 직접법 해의 정확도를 검증하기 위한 고정밀 기준해(reference solution)를 간접법으로 생성한다.
최적 구조의 분석: 최적 제어의 전환 구조(뱅뱅, 특이, 경계 호 등)를 이론적으로 분석한다.
특수 구조의 활용: 문제의 해밀토니안 구조를 활용한 심플렉틱 적분기의 적용이 가능하다.

8. 참고 문헌

Bryson, A. E., & Ho, Y.-C. (1975). Applied Optimal Control: Optimization, Estimation, and Control. Hemisphere Publishing.
Bock, H. G., & Plitt, K. J. (1984). “A Multiple Shooting Algorithm for Direct Solution of Optimal Control Problems.” Proceedings of the 9th IFAC World Congress, 243–247.
Betts, J. T. (2010). Practical Methods for Optimal Control and Estimation Using Nonlinear Programming (2nd ed.). SIAM.
Stoer, J., & Bulirsch, R. (2002). Introduction to Numerical Analysis (3rd ed.). Springer.

version: 1.0