7.162 실시간 제약 조건하의 온라인 최적화 전략

1. 실시간 온라인 최적화의 과제

로봇 제어에서 온라인 최적화는 센서 데이터의 수신, 최적화 문제의 구성, 해의 계산, 제어 명령의 적용이 모두 제어 주기 $T_{ctrl}$ (통상 1~10ms) 내에 완료되어야 한다. 계산 지연(computational delay)은 제어 성능의 저하와 안정성의 위협으로 이어지므로, 계산 시간의 확정적 상한 보장이 필수적이다.

2. 계산 파이프라인의 구조

2.1 순차적 파이프라인

센서 → 상태 추정 → 최적화 → 제어 명령의 순차적 처리이다. 각 단계의 지연이 누적되어 총 지연이 제어 주기를 초과할 수 있다.

2.2 파이프라인 병렬화

이전 주기의 센서 데이터에 기반한 최적화와 현재 주기의 센서 수집을 병렬로 수행한다. 한 주기의 지연이 발생하지만 처리량(throughput)이 향상된다.

2.3 RTI의 준비-피드백 분리

비선형 MPC의 RTI에서 준비 단계(선형화, QP 구성)를 피드백 단계(QP 해법)와 시간적으로 분리한다. 피드백 단계의 지연만이 센서-행동 경로(sensor-to-action latency)에 포함되므로, 실질적 지연이 최소화된다.

3. 부분 최적화 전략

3.1 고정 반복 횟수

최적화 반복 횟수를 사전에 고정( $N_{iter}$ )하여 최악 경우 계산 시간을 확정한다. 웜 스타트에 의해 소수의 반복( $N_{iter} = 1 \sim 5$ )으로도 충분히 양호한 해를 산출하는 경우가 많다.

3.2 시간 제한 최적화(Anytime Optimization)

가용 시간 내에서 최대한 반복하고, 시간 한계에 도달하면 현재까지의 최선 해를 반환하는 전략이다. 반복이 진행될수록 해의 품질이 단조 개선되는 알고리즘(경사 하강법, 능동집합법 등)이 이 전략에 적합하다.

3.3 조기 종료(Early Termination)

수렴 기준이 만족되면 최대 반복 이전에 종료하여 계산 자원을 절약한다. 절약된 자원은 다른 계산(환경 인식, 의사결정 등)에 할당된다.

4. 문제 규모의 관리

4.1 예측 지평의 조절

MPC에서 예측 지평 $N$ 을 줄이면 QP/NLP의 규모가 감소하여 해법 시간이 단축된다. 그러나 지평이 짧으면 장기적 성능과 안정성이 저하될 수 있으므로, 계산 예산과 성능의 균형이 필요하다.

4.2 이산화 해상도의 조절

격자의 밀도를 줄이면 결정 변수의 수가 감소한다. 가까운 미래는 조밀하게, 먼 미래는 성글게 이산화하는 비균일 격자가 사용된다.

4.3 제약의 선별적 활성화

모든 장애물에 대한 충돌 회피 제약을 포함하면 QP의 규모가 증가한다. 로봇에 가까운 장애물만을 선별하여 제약에 포함하는 전략이 계산 효율을 향상시킨다.

5. 코드 최적화와 하드웨어 활용

5.1 자동 코드 생성

CVXGEN, FORCES Pro, acados 등의 도구가 특정 최적화 문제의 구조에 맞춘 C 코드를 자동 생성한다. 루프 전개, 인라인 연산, 분기 제거 등의 최적화가 적용되어 범용 해법기 대비 현저한 속도 향상을 달성한다.

5.2 SIMD와 GPU 활용

행렬 연산의 SIMD(Single Instruction, Multiple Data) 벡터화와 GPU 병렬 처리가 QP 해법의 가속에 활용된다. 특히 다수의 독립적 QP를 동시에 풀어야 하는 경우(다중 로봇, 몬테카를로 트리 탐색 등) GPU 병렬화가 효과적이다.

5.3 행렬 분해의 캐싱

MPC에서 KKT 행렬의 구조(시스템 행렬 $\mathbf{A}, \mathbf{B}$ )가 반복에 걸쳐 변하지 않으면, 행렬 분해를 사전에 수행하고 온라인에서는 후방 대입만을 수행한다. ADMM(OSQP)에서 이 전략이 표준적으로 사용된다.

6. 안전 보장 메커니즘

실시간 제약으로 인해 최적화가 불완전하게 종료되는 경우, 시스템의 안전을 보장하기 위한 메커니즘이 필수적이다.

허용 가능 대안(feasible fallback): 최적화가 제시간에 수렴하지 못하면, 이전 해를 유지하거나 사전 계산된 안전 궤적으로 전환한다.

안전 필터(safety filter): 최적화 출력이 안전 제약을 위반하면, 안전 제약을 만족하도록 최소한의 수정을 가한다. 제어 장벽 함수(Control Barrier Function, CBF) 기반 안전 필터가 대표적이다.

7. 참고 문헌

Diehl, M., et al. (2005). “A Real-Time Iteration Scheme for Nonlinear Optimization in Optimal Feedback Control.” SIAM Journal on Control and Optimization, 43(5), 1714–1736.
Verschueren, R., et al. (2022). “acados — A Modular Open-Source Framework for Fast Embedded Optimal Control.” Mathematical Programming Computation, 14, 147–183.
Mattingley, J., & Boyd, S. (2012). “CVXGEN: A Code Generator for Embedded Convex Optimization.” Optimization and Engineering, 13(1), 1–27.
Ames, A. D., et al. (2019). “Control Barrier Functions: Theory and Applications.” Proceedings of the European Control Conference (ECC), 3420–3431.

version: 1.0