7.143 직접 전사법과 직접 배치법

1. 직접법의 기본 원리

직접법(direct method)은 연속 시간 최적 제어 문제를 “먼저 이산화하고 그 다음 최적화”(discretize-then-optimize)하는 접근법이다. 시간 축을 이산화하여 상태와 제어 입력을 유한 개의 결정 변수로 매개변수화하고, 동역학 제약을 대수적 등식 제약으로 변환하여 유한 차원 비선형 계획 문제(NLP)를 구성한다.

2. 직접 전사법(Direct Transcription)

2.1 오일러 전사

가장 단순한 이산화로, 전진 오일러법을 적용한다.

\mathbf{x}_{k+1} = \mathbf{x}_k + h_k \mathbf{f}(\mathbf{x}_k, \mathbf{u}_k)

이 등식 제약을 NLP에 포함시킨다. 1차 정확도(O(h))이므로 정밀한 결과를 위해 조밀한 격자가 필요하다.

2.2 암시적 사다리꼴 전사

\mathbf{x}_{k+1} = \mathbf{x}_k + \frac{h_k}{2}[\mathbf{f}(\mathbf{x}_k, \mathbf{u}_k) + \mathbf{f}(\mathbf{x}_{k+1}, \mathbf{u}_{k+1})]

2차 정확도(O(h^2))이며, 암시적이므로 \mathbf{x}_{k+1}이 양변에 나타난다. 결정 변수로 \mathbf{x}_{k+1}을 포함하므로 직접 배치법의 틀에서 자연스럽게 처리된다. A-안정(A-stable)이므로 강성(stiff) 시스템에도 적합하다.

2.3 룽게-쿠타 전사

고차 룽게-쿠타(RK) 방법을 이산화에 사용하면 적은 격자점으로도 높은 정확도를 달성할 수 있다. 4차 RK의 경우 O(h^4) 정확도이다.

3. 직접 배치법(Direct Collocation)

3.1 원리

직접 배치법은 상태 궤적을 각 구간에서 다항식으로 근사하고, 동역학 방정식이 배치점(collocation point)에서 정확히 만족되도록 등식 제약을 부과한다.

구간 [\tau_k, \tau_{k+1}]에서 상태를 다항식 \mathbf{p}(t)로 보간하면, 연속 시간 동역학 \dot{\mathbf{x}} = \mathbf{f}(\mathbf{x}, \mathbf{u})는 배치점 t_c에서 다음의 조건으로 부과된다.

\dot{\mathbf{p}}(t_c) = \mathbf{f}(\mathbf{p}(t_c), \mathbf{u}(t_c))

3.2 에르미트-심프슨 배치(Hermite-Simpson Collocation)

가장 널리 사용되는 배치법으로, 3차 에르미트 다항식 보간과 심프슨 적분 규칙의 결합이다. 구간 중점 t_{k+1/2} = (\tau_k + \tau_{k+1})/2에서의 상태를 다음과 같이 정의한다.

\mathbf{x}_{k+1/2} = \frac{1}{2}(\mathbf{x}_k + \mathbf{x}_{k+1}) + \frac{h_k}{8}(\mathbf{f}_k - \mathbf{f}_{k+1})

배치 조건(결함 제약):

\mathbf{x}_{k+1} - \mathbf{x}_k - \frac{h_k}{6}(\mathbf{f}_k + 4\mathbf{f}_{k+1/2} + \mathbf{f}_{k+1}) = \mathbf{0}

여기서 \mathbf{f}_k = \mathbf{f}(\mathbf{x}_k, \mathbf{u}_k), \mathbf{f}_{k+1/2} = \mathbf{f}(\mathbf{x}_{k+1/2}, \mathbf{u}_{k+1/2})이다. 이 방법은 4차 정확도(O(h^4))를 달성한다.

3.3 가우스-르장드르 배치(Gauss-Legendre Collocation)

가우스 구적법의 배치점을 사용하면, s개의 배치점으로 2s차 정확도를 달성할 수 있다. 이는 암시적 룽게-쿠타 방법과 수학적으로 동치이며, 최고 차수의 정확도를 제공한다. 그러나 구현이 에르미트-심프슨보다 복잡하다.

3.4 라다우 배치(Radau Collocation)

구간의 끝점을 배치점에 포함하는 라다우 구적법에 기반한다. s개의 배치점으로 2s-1차 정확도를 달성한다. L-안정(L-stable)이므로 강성 시스템에 특히 적합하며, 접촉 역학을 포함하는 로봇 궤적 최적화에서 선호된다.

4. NLP의 구조와 해법

직접 배치법에 의한 NLP는 다음의 형태이다.

\min_{\mathbf{z}} \quad F(\mathbf{z}) \quad \text{s.t.} \quad \mathbf{c}_{eq}(\mathbf{z}) = \mathbf{0}, \quad \mathbf{c}_{ineq}(\mathbf{z}) \leq \mathbf{0}

결정 변수 \mathbf{z}는 모든 격자점에서의 상태와 제어 입력을 포함한다. 등식 제약 \mathbf{c}_{eq}는 결함 제약(동역학), 경계 조건, 연속성 조건을 포함하고, 부등식 제약 \mathbf{c}_{ineq}는 경로 제약(관절 한계, 장애물 회피 등)을 포함한다.

이 NLP는 IPOPT(내점법), SNOPT(SQP) 등의 대규모 NLP 해법기로 풀린다. 야코비안의 희소 구조를 활용하는 것이 효율성의 핵심이다.

5. 직접 사격법과 직접 배치법의 비교

특성직접 사격법직접 배치법
결정 변수\mathbf{u}_k (제어만)\mathbf{x}_k, \mathbf{u}_k (상태+제어)
변수 수N \cdot n_uN \cdot (n_x + n_u)
동역학 만족항상 만족 (적분에 의해)NLP 수렴 시 만족
경로 제약간접적 처리직접 부과 가능
수치 안정성카오틱 시스템에서 불안정양호
NLP 구조밀집희소 (밴드)
웜 스타트제어만 초기화상태+제어 초기화

6. 격자 정제(Mesh Refinement)

초기 조밀하지 않은 격자로 시작하여, 해의 정확도를 평가한 후 오차가 큰 구간에서 격자를 조밀하게 하는 적응적 격자 정제 전략이 사용된다. 이산화 오차의 추정은 인접 격자 크기의 해 비교 또는 적분 잔차의 평가로 수행된다.

7. 참고 문헌

  • Betts, J. T. (2010). Practical Methods for Optimal Control and Estimation Using Nonlinear Programming (2nd ed.). SIAM.
  • Kelly, M. (2017). “An Introduction to Trajectory Optimization: How to Do Your Own Direct Collocation.” SIAM Review, 59(4), 849–904.
  • Hargraves, C. R., & Paris, S. W. (1987). “Direct Trajectory Optimization Using Nonlinear Programming and Collocation.” Journal of Guidance, Control, and Dynamics, 10(4), 338–342.
  • Patterson, M. A., & Rao, A. V. (2014). “GPOPS-II: A MATLAB Software for Solving Multiple-Phase Optimal Control Problems Using hp-Adaptive Gaussian Quadrature Collocation Methods.” ACM Transactions on Mathematical Software, 41(1), 1–37.

version: 1.0