7.78 시간 최적 제어와 에너지 최적 제어

1. 시간 최적 제어 문제

1.1 문제의 정식화

시간 최적 제어(time-optimal control)는 시스템이 초기 상태 $\mathbf{x}_0$ 에서 목표 상태 $\mathbf{x}_f$ 로 이동하는 데 소요되는 시간을 최소화하는 문제이다. 성능 지표는 다음과 같이 정의된다.

$J = t_f - t_0 = \int_{t_0}^{t_f} 1 \, dt$

여기서 $t_f$ 는 자유 종단 시간이며, 최적화 변수에 포함된다. 제어 입력은 물리적 한계에 의해 구속된다.

$\mathbf{u}(t) \in \mathcal{U} = \{ \mathbf{u} \in \mathbb{R}^m : \lvert u_i \rvert \leq u_{i,\max}, \, i = 1, \ldots, m \}$

이 문제는 자유 시간 문제이므로 종단 시각에 대한 횡단성 조건이 추가적으로 요구된다.

1.2 해밀토니안과 최대 원리의 적용

적분 비용 $L = 1$ 로부터 해밀토니안은 다음과 같다.

$H = 1 + \boldsymbol{\lambda}^T \mathbf{f}(\mathbf{x}, \mathbf{u}, t)$

폰트랴긴의 최대 원리에 의하면, 최적 제어 $\mathbf{u}^*(t)$ 는 매 시각에서 해밀토니안을 최소화한다.

$\mathbf{u}^*(t) = \arg\min_{\mathbf{u} \in \mathcal{U}} H = \arg\min_{\mathbf{u} \in \mathcal{U}} \boldsymbol{\lambda}^T(t) \mathbf{f}(\mathbf{x}(t), \mathbf{u}, t)$

자유 종단 시간의 횡단성 조건에 의해 최적 궤적을 따라 다음이 성립한다.

$H^*(t) = 0, \quad \forall t \in [t_0, t_f]$

1.3 선형 시스템에서의 뱅뱅 제어

선형 시간 불변 시스템 $\dot{\mathbf{x}} = \mathbf{A}\mathbf{x} + \mathbf{B}\mathbf{u}$ 에서 해밀토니안은 제어 입력에 대해 선형이다.

$H = 1 + \boldsymbol{\lambda}^T\mathbf{A}\mathbf{x} + \boldsymbol{\lambda}^T\mathbf{B}\mathbf{u} = 1 + \boldsymbol{\lambda}^T\mathbf{A}\mathbf{x} + \sum_{i=1}^{m} \sigma_i(t) u_i$

여기서 $\sigma_i(t) = \boldsymbol{\lambda}^T(t) \mathbf{b}_i$ 는 전환 함수(switching function)이고, $\mathbf{b}_i$ 는 $\mathbf{B}$ 의 $i$ 번째 열벡터이다. 해밀토니안이 $u_i$ 에 대해 선형이므로, 각 입력 성분의 최적 값은 다음과 같다.

$u_i^*(t) = \begin{cases} -u_{i,\max} & \text{if } \sigma_i(t) > 0 \\ +u_{i,\max} & \text{if } \sigma_i(t) < 0 \end{cases}$

제어 입력이 허용 범위의 극단값 사이를 전환하는 이러한 제어를 뱅뱅 제어(bang-bang control)라 한다. 전환 시각(switching time)은 $\sigma_i(t) = 0$ 이 되는 시점에서 발생한다.

1.4 이중 적분기의 시간 최적 제어

로봇 관절의 단순화 모델인 이중 적분기 $\ddot{q} = u$ , $\lvert u \rvert \leq 1$ 을 고려하라. 상태를 $x_1 = q$ , $x_2 = \dot{q}$ 로 정의하면 다음의 상태 방정식을 얻는다.

$\dot{x}_1 = x_2, \quad \dot{x}_2 = u$

공상태 방정식은 다음과 같다.

$\dot{\lambda}_1 = 0, \quad \dot{\lambda}_2 = -\lambda_1$

이로부터 $\lambda_1 = c_1$ (상수), $\lambda_2(t) = -c_1 t + c_2$ 이다. 전환 함수는 $\sigma(t) = \lambda_2(t) = -c_1 t + c_2$ 로 $t$ 에 대한 1차 함수이므로, 전환은 최대 1회 발생한다. 따라서 이중 적분기의 시간 최적 제어는 최대 1회의 전환을 갖는 뱅뱅 제어이다.

전환 곡선(switching curve)은 위상 평면 $(x_1, x_2)$ 에서 다음과 같이 주어진다.

$x_1 = -\frac{1}{2} \text{sgn}(x_2) \, x_2^2$

이 곡선의 상부에서는 $u^* = -1$ , 하부에서는 $u^* = +1$ 이 적용되며, 시스템은 전환 곡선을 따라 원점에 도달한다.

1.5 전환 횟수에 관한 정리

펠트바움(Feldbaum)의 정리에 의하면, $n$ 차 선형 시간 불변 시스템의 시간 최적 뱅뱅 제어에서 전환 횟수는 최대 $n-1$ 회이다. 또한, 시스템 행렬 $\mathbf{A}$ 의 고유값이 모두 실수이면 전환 횟수가 정확히 $n-1$ 회임이 보장된다.

1.6 특이 호 문제

전환 함수 $\sigma_i(t)$ 가 유한 시간 구간에서 항등적으로 영이 되는 경우, 해밀토니안 최소화 조건만으로는 최적 제어를 결정할 수 없다. 이를 특이 호(singular arc) 문제라 하며, 특이 제어(singular control)를 결정하기 위해 전환 함수의 시간 미분을 반복적으로 계산하는 켈리 조건(Kelley condition) 또는 일반화된 르장드르-클레브쉬 조건(generalized Legendre-Clebsch condition)이 사용된다.

$(-1)^k \frac{\partial}{\partial u} \left[ \frac{d^{2k}}{dt^{2k}} \left( \frac{\partial H}{\partial u} \right) \right] \geq 0$

여기서 $k$ 는 $\sigma(t) = 0$ 조건을 제어 $u$ 가 명시적으로 나타날 때까지 미분해야 하는 최소 횟수이다.

2. 에너지 최적 제어 문제

2.1 문제의 정식화

에너지 최적 제어(energy-optimal control)는 시스템의 상태 전이를 달성하면서 제어 입력의 에너지를 최소화하는 문제이다. 가장 기본적인 형식은 다음과 같다.

$J = \frac{1}{2}\int_{t_0}^{t_f} \mathbf{u}^T(t)\mathbf{R}\mathbf{u}(t) \, dt$

여기서 $\mathbf{R} \succ 0$ 은 양정치 가중 행렬이고, $t_f$ 는 고정되어 있다. 이 성능 지표는 제어 입력의 가중 제곱 적분을 나타내며, 물리적으로 액추에이터에 의해 소비되는 에너지에 비례한다.

2.2 해밀토니안과 최적 제어

해밀토니안은 다음과 같다.

$H = \frac{1}{2}\mathbf{u}^T\mathbf{R}\mathbf{u} + \boldsymbol{\lambda}^T\mathbf{f}(\mathbf{x}, \mathbf{u}, t)$

제어 입력에 제약이 없는 경우, 정류 조건 $\frac{\partial H}{\partial \mathbf{u}} = \mathbf{0}$ 으로부터 최적 제어를 얻는다.

$\mathbf{u}^*(t) = -\mathbf{R}^{-1} \left( \frac{\partial \mathbf{f}}{\partial \mathbf{u}} \right)^T \boldsymbol{\lambda}^*(t)$

선형 시스템 $\dot{\mathbf{x}} = \mathbf{A}\mathbf{x} + \mathbf{B}\mathbf{u}$ 의 경우 이는 다음으로 단순화된다.

$\mathbf{u}^*(t) = -\mathbf{R}^{-1}\mathbf{B}^T\boldsymbol{\lambda}^*(t)$

에너지 최적 제어는 연속적이고 매끄러운 특성을 가지며, 시간 최적 제어의 뱅뱅 구조와 대비된다.

2.3 선형 시스템의 에너지 최적 해

선형 시간 불변 시스템에서 고정 경계 조건( $\mathbf{x}(t_0) = \mathbf{x}_0$ , $\mathbf{x}(t_f) = \mathbf{x}_f$ )하의 에너지 최적 제어는 해석적으로 구할 수 있다.

공상태 방정식 $\dot{\boldsymbol{\lambda}} = -\mathbf{A}^T\boldsymbol{\lambda}$ 의 해는 $\boldsymbol{\lambda}(t) = e^{-\mathbf{A}^T(t - t_0)}\boldsymbol{\lambda}_0$ 이고, 최적 제어는 다음과 같다.

$\mathbf{u}^*(t) = -\mathbf{R}^{-1}\mathbf{B}^T e^{-\mathbf{A}^T(t - t_0)}\boldsymbol{\lambda}_0$

경계 조건을 만족시키면 $\boldsymbol{\lambda}_0$ 가 결정되며, 그래미안(Gramian) 행렬

$\mathbf{W}(t_0, t_f) = \int_{t_0}^{t_f} e^{\mathbf{A}(t_f - s)}\mathbf{B}\mathbf{R}^{-1}\mathbf{B}^T e^{\mathbf{A}^T(t_f - s)} ds$

이 비특이(nonsingular)이면, 즉 시스템이 가제어(controllable)이면, 다음의 해를 얻는다.

$\boldsymbol{\lambda}_0 = -e^{\mathbf{A}^T(t_f - t_0)} \mathbf{W}^{-1}(t_0, t_f) \left[ \mathbf{x}_f - e^{\mathbf{A}(t_f - t_0)}\mathbf{x}_0 \right]$

3. 시간 최적과 에너지 최적의 비교

두 최적화 기준은 근본적으로 다른 제어 구조를 산출한다.

특성	시간 최적 제어	에너지 최적 제어
성능 지표	$J = t_f$	$J = \frac{1}{2}\int \mathbf{u}^T\mathbf{R}\mathbf{u} \, dt$
제어 구조	뱅뱅(불연속)	연속, 매끄러움
종단 시각	자유(최적화 변수)	고정(주어짐)
제어 크기	항상 최대(경계에 위치)	가변(공상태에 비례)
액추에이터 부하	최대	최소화
해밀토니안 조건	$H^* = 0$	$H^*$ 불변(자율 시스템)

4. 가중 복합 성능 지표

실제 로봇 시스템에서는 시간 최소화와 에너지 최소화를 동시에 고려하는 복합 성능 지표가 사용된다.

$J = \alpha \, t_f + \frac{1}{2}\int_{t_0}^{t_f} \mathbf{u}^T\mathbf{R}\mathbf{u} \, dt$

여기서 $\alpha > 0$ 은 시간 비용과 에너지 비용 사이의 상대적 가중치를 조절하는 계수이다. $\alpha$ 가 크면 시간 최적 해에 가까워지고, $\alpha$ 가 작으면 에너지 최적 해에 가까워진다.

이 문제의 해밀토니안은 다음과 같다.

$H = \alpha + \frac{1}{2}\mathbf{u}^T\mathbf{R}\mathbf{u} + \boldsymbol{\lambda}^T\mathbf{f}(\mathbf{x}, \mathbf{u}, t)$

자유 종단 시간의 경우 횡단성 조건 $H^*(t_f) = 0$ 이 적용되며, 이로부터 종단 시각이 결정된다. 이 복합 문제의 해는 제어 입력에 구간 제약이 있을 때 시간 최적과 에너지 최적의 중간 특성을 보인다. 제어 입력이 허용 범위의 경계에 놓이는 구간(포화 구간)과 내부에 놓이는 구간(비포화 구간)이 혼재하게 된다.

5. 로봇 공학에서의 응용

5.1 산업용 로봇의 사이클 시간 최적화

산업용 매니퓰레이터의 반복 작업에서 사이클 시간의 최소화는 생산성 향상에 직결된다. 시간 최적 제어를 적용하여 관절 토크의 물리적 한계 내에서 점대점 이동의 최소 시간 궤적을 생성한다. 뱅뱅 제어 구조에 의해 각 관절 토크가 가감속 구간에서 최대값에 도달하며, 전환 시각의 최적 배분이 핵심 설계 문제가 된다.

5.2 이동 로봇과 자율 비행체의 에너지 효율

배터리 구동 이동 로봇이나 무인 비행체에서는 에너지 최적 제어가 운용 시간의 극대화에 필수적이다. 에너지 최적 궤적은 급격한 가감속을 회피하고 매끄러운 속도 프로파일을 생성하며, 이는 배터리 소모를 최소화한다.

5.3 시간-에너지 상충 관계

실제 로봇 운용에서는 시간과 에너지 사이의 상충 관계(trade-off)를 고려해야 한다. 파레토 최적 전선(Pareto optimal front) 분석을 통해 주어진 시간 제약에서의 최소 에너지 또는 주어진 에너지 예산에서의 최소 시간을 체계적으로 평가할 수 있다. 가중 계수 $\alpha$ 를 변화시키면서 복합 문제를 반복적으로 풀면 파레토 전선의 근사를 얻을 수 있다.

6. 참고 문헌

Athans, M., & Falb, P. L. (1966). Optimal Control: An Introduction to the Theory and Its Applications. McGraw-Hill.
Kirk, D. E. (2004). Optimal Control Theory: An Introduction. Dover Publications.
Bryson, A. E., & Ho, Y.-C. (1975). Applied Optimal Control: Optimization, Estimation, and Control. Hemisphere Publishing.
Bobrow, J. E., Dubowsky, S., & Gibson, J. S. (1985). “Time-Optimal Control of Robotic Manipulators Along Specified Paths.” The International Journal of Robotics Research, 4(3), 3–17.
Lewis, F. L., Vrabie, D., & Syrmos, V. L. (2012). Optimal Control (3rd ed.). Wiley.

version: 1.0