7.156 모델 예측 제어(MPC)의 최적화 구조

1. MPC의 기본 구조

모델 예측 제어(Model Predictive Control, MPC)는 매 제어 주기에서 유한 시간 지평의 최적 제어 문제를 온라인으로 풀고, 최적 제어 시퀀스의 첫 번째 요소만을 적용하는 이동 지평(receding horizon) 제어 전략이다.

1.1 알고리즘

현재 상태 $\mathbf{x}_k$ 를 측정(또는 추정)한다.
유한 지평 $[k, k+N]$ 에서의 최적 제어 문제를 풀어 최적 시퀀스 $\mathbf{u}_0^*, \ldots, \mathbf{u}_{N-1}^*$ 를 구한다.
$\mathbf{u}_0^*$ 만을 시스템에 적용한다.
다음 주기에서 1단계로 돌아간다.

2. 최적화 문제의 구조

2.1 선형 MPC의 QP 구조

선형 시스템 $\mathbf{x}_{k+1} = \mathbf{A}\mathbf{x}_k + \mathbf{B}\mathbf{u}_k$ 와 이차 비용의 조합에서 MPC 문제는 볼록 이차 계획(QP)이다.

$\min_{\mathbf{U}} \quad \frac{1}{2}\mathbf{U}^T\mathbf{H}\mathbf{U} + \mathbf{x}_k^T\mathbf{F}\mathbf{U} + \text{const.}$

$\text{s.t.} \quad \mathbf{G}\mathbf{U} \leq \mathbf{w} + \mathbf{E}\mathbf{x}_k$

QP의 구조는 예측 지평 $N$ , 상태 차원 $n_x$ , 입력 차원 $n_u$ 에 의해 결정되며, 밴드 희소 구조를 갖는다.

2.2 비선형 MPC의 NLP 구조

비선형 시스템 $\mathbf{x}_{k+1} = \mathbf{f}(\mathbf{x}_k, \mathbf{u}_k)$ 에서 MPC 문제는 비선형 계획(NLP)이 된다.

$\min_{\mathbf{X}, \mathbf{U}} \quad \phi(\mathbf{x}_N) + \sum_{k=0}^{N-1} L(\mathbf{x}_k, \mathbf{u}_k)$

$\text{s.t.} \quad \mathbf{x}_{k+1} = \mathbf{f}(\mathbf{x}_k, \mathbf{u}_k), \quad \mathbf{g}(\mathbf{x}_k, \mathbf{u}_k) \leq \mathbf{0}$

이 NLP는 SQP 또는 내점법으로 풀리며, 각 SQP 반복에서 QP 하위 문제가 발생한다.

3. 밀집 형식과 희소 형식

3.1 밀집 형식(Dense / Condensed)

동역학 등식 제약을 이용하여 상태 변수를 소거하고, 제어 입력만을 결정 변수로 유지한다. 결정 변수 수는 $N \cdot n_u$ 이고, 헤시안이 밀집 행렬이다. 소규모 문제( $N \cdot n_u < 100$ )에서 효율적이다.

3.2 희소 형식(Sparse)

상태와 입력을 모두 결정 변수로 유지하고, 동역학을 등식 제약으로 명시적으로 포함한다. 결정 변수 수는 $N \cdot (n_x + n_u)$ 로 크지만, KKT 시스템이 블록 밴드 구조를 갖는다. 리카티 재귀에 의해 $O(N(n_x + n_u)^3)$ 에 풀 수 있으며, 대규모 문제에서 효율적이다.

4. 종단 비용과 안정성

4.1 종단 비용(Terminal Cost)

유한 지평 MPC에서 종단 비용 $\phi(\mathbf{x}_N)$ 은 지평 이후의 비용을 근사하는 역할을 한다. 적절한 종단 비용을 선택하면 폐루프 안정성을 보장할 수 있다. 선형 시스템에서 무한 지평 LQR의 비용 $\mathbf{x}_N^T\mathbf{P}\mathbf{x}_N$ ( $\mathbf{P}$ 는 대수 리카티 방정식의 해)이 표준 선택이다.

4.2 종단 제약(Terminal Constraint)

종단 상태가 원점 근방의 안정 영역 내에 놓이도록 제약을 부과하면 안정성이 보장된다.

$\mathbf{x}_N \in \mathcal{X}_f$

여기서 $\mathcal{X}_f$ 는 종단 제약 집합(terminal constraint set)이다.

4.3 종단 비용과 종단 제약의 조합

종단 비용으로서 리아프노프 함수, 종단 제약으로서 제어 불변 집합(control invariant set)을 사용하면, 재귀적 실현 가능성(recursive feasibility)과 점근적 안정성이 동시에 보장된다.

5. 실시간 해법의 핵심 기법

리카티 기반 QP 해법: 희소 형식의 KKT 시스템을 리카티 재귀로 $O(N)$ 에 풀어 실시간 성능을 확보한다.

RTI(Real-Time Iteration): 비선형 MPC에서 SQP의 단일 반복으로 근사 해를 산출하여 계산 시간을 제어 주기에 맞춘다.

명시적 MPC(Explicit MPC): 소규모 선형 MPC에서 매개변수적 QP를 사전에 풀어, 온라인에서는 탐색(lookup)만으로 제어를 결정한다. 상태 공간이 다면체 영역으로 분할되고 각 영역에서 최적 제어가 아핀 함수이다.

6. 로봇 공학 응용에서의 MPC 구조

응용	모델	비용	제약	해법
이동 로봇 추종	자전거 모델	횡편차 + 조향	조향 한계	선형 MPC(QP)
보행 로봇	LIPM	CoM 편차	ZMP, 발 위치	QP
매니퓰레이터	비선형 동역학	추종 오차 + 토크	관절/토크 한계	NLP(RTI)
드론	비선형 6DoF	추종 + 에너지	추력, 자세	NLP(acados)

7. 참고 문헌

Rawlings, J. B., Mayne, D. Q., & Diehl, M. (2017). Model Predictive Control: Theory, Computation, and Design (2nd ed.). Nob Hill Publishing.
Borrelli, F., Bemporad, A., & Morari, M. (2017). Predictive Control for Linear and Hybrid Systems. Cambridge University Press.
Diehl, M., et al. (2005). “A Real-Time Iteration Scheme for Nonlinear Optimization in Optimal Feedback Control.” SIAM Journal on Control and Optimization, 43(5), 1714–1736.
Verschueren, R., et al. (2022). “acados — A Modular Open-Source Framework for Fast Embedded Optimal Control.” Mathematical Programming Computation, 14, 147–183.

version: 1.0