16.48 에너지 기반 제어에서의 해밀턴 역학

1. 개요

에너지 기반 제어(energy-based control)는 시스템의 에너지 함수를 제어 설계의 중심에 두는 방법론으로서, 비선형 기계 시스템의 제어에서 견고하고 직관적이며 물리적으로 의미 있는 제어기를 설계할 수 있게 한다. 해밀턴 역학은 시스템의 총 에너지를 해밀터니안으로 명시적으로 표현하므로 이러한 제어 패러다임의 자연스러운 수학적 토대를 제공한다. 해밀턴 정식화에서는 일반화 좌표와 일반화 운동량이 정준 변수의 짝을 이루며, 시스템의 에너지 흐름이 명료하게 추적된다.

본 절에서는 해밀턴 역학이 에너지 기반 제어 설계에 어떻게 활용되는지를 학술적으로 기술한다. 구체적으로 수동성 기반 제어, 에너지 형성(energy shaping) 제어, 인터커넥션 및 댐핑 할당(Interconnection and Damping Assignment, IDA) 기법, 그리고 이러한 기법이 로봇 시스템의 안정화와 궤적 추종에 적용되는 방식을 다룬다.

2. 기계 시스템의 해밀턴 정식화

표준 기계 시스템의 해밀터니안은 다음과 같이 운동 에너지와 위치 에너지의 합으로 표현된다.

$H(q, p) = \frac{1}{2} p^T M^{-1}(q) p + V(q)$

여기서 $q \in \mathbb{R}^n$ 은 일반화 좌표, $p \in \mathbb{R}^n$ 은 일반화 운동량, $M(q)$ 는 양의 정부호 관성 행렬, $V(q)$ 는 위치 에너지이다. 외부 입력 $\tau \in \mathbb{R}^n$ 이 작용하는 경우 정준 방정식은 다음과 같이 확장된다.

$\dot{q} = \frac{\partial H}{\partial p}, \quad \dot{p} = -\frac{\partial H}{\partial q} + \tau$

이 형태는 입력이 운동량 동역학에 직접 작용하는 구조를 명시적으로 보여 준다. 입력의 기계적 일률은 다음과 같이 표현된다.

$\frac{dH}{dt} = \tau^T \dot{q}$

이 관계는 시스템이 에너지 측면에서 수동(passive)임을 의미하며, $\dot{q}$ 를 출력으로 선택하면 입력-출력 쌍 $(\tau, \dot{q})$ 에 대하여 시스템이 수동성 부등식을 만족함을 보장한다.

3. 수동성과 안정화

수동성(passivity)은 시스템이 외부로부터 공급된 에너지 이상을 산출하지 않는다는 물리적 직관을 수학적으로 형식화한 개념이다. 저장 함수(storage function) $S(x) \geq 0$ 가 다음 부등식을 만족할 때 시스템은 수동이다.

$\dot{S}(x) \leq u^T y$

기계 시스템에서 해밀터니안 $H$ 는 자연스러운 저장 함수 후보가 되며, 출력을 $y = \dot{q}$ 로 선택하면 위 부등식이 등식으로 성립한다. 이 사실은 수동성 기반 제어 설계의 출발점이다.

가장 단순한 수동성 기반 안정화는 다음과 같은 비례-미분 제어를 통하여 이루어진다.

$\tau = -K_p (q - q^*) - K_d \dot{q} + g(q)$

여기서 $g(q) = \partial V / \partial q$ 는 중력 보상항이고, $K_p, K_d$ 는 양의 정부호 행렬이다. 폐루프 시스템의 에너지 함수를 다음과 같이 정의하면,

$H_{\text{cl}}(q, p) = \frac{1}{2} p^T M^{-1}(q) p + \frac{1}{2}(q - q^*)^T K_p (q - q^*)$

이 함수는 평형점 $(q^*, 0)$ 에서 최솟값을 가지며 폐루프 시스템의 리아푸노프(Lyapunov) 함수가 된다. 미분 항은 시스템에 댐핑을 도입하여 점근 안정성을 보장한다.

4. 에너지 형성 제어

에너지 형성(energy shaping) 제어는 폐루프 시스템의 에너지 함수가 원하는 형태를 갖도록 입력을 설계하는 방법이다. 이 접근은 두 단계로 구성된다. 첫째, 폐루프 위치 에너지 $V_d(q)$ 를 평형점이 원하는 위치에서 최솟값을 가지도록 설계한다. 둘째, 운동량 분포에 댐핑 주입(damping injection)을 통하여 점근 안정성을 확보한다.

이 절차의 핵심 제약은 매칭 조건(matching condition)이라 불리는 편미분 방정식이며, 이는 원하는 폐루프 동역학이 입력 채널을 통하여 실제로 구현 가능한지를 결정한다. 매칭 조건은 다음 형태로 표현된다.

$G^{\perp}(q) \left[ \frac{\partial H_d}{\partial q} - M_d M^{-1} \frac{\partial H}{\partial q} \right] = 0$

여기서 $G^{\perp}$ 는 입력 행렬의 좌영(left annihilator), $M_d$ 와 $H_d$ 는 원하는 폐루프 관성 행렬과 해밀터니안이다. 이 조건의 만족 가능성은 시스템의 제어 가능성과 깊은 관계를 가진다.

5. 인터커넥션 및 댐핑 할당 (IDA)

오르테가(Ortega) 등이 제안한 IDA 기법은 포트-해밀턴 시스템의 일반적인 형태를 출발점으로 하여, 폐루프 시스템이 원하는 인터커넥션 행렬과 댐핑 행렬, 그리고 원하는 에너지 함수를 가지도록 입력을 설계한다. 개루프 시스템이 다음의 형태로 주어진다고 하자.

$\begin{bmatrix} \dot{q} \\ \dot{p} \end{bmatrix} = \begin{bmatrix} 0 & I \\ -I & 0 \end{bmatrix} \begin{bmatrix} \partial H / \partial q \\ \partial H / \partial p \end{bmatrix} + \begin{bmatrix} 0 \\ G(q) \end{bmatrix} u$

폐루프 시스템이 다음 형태를 가지도록 한다.

$\begin{bmatrix} \dot{q} \\ \dot{p} \end{bmatrix} = \left[ J_d(q, p) - R_d(q, p) \right] \begin{bmatrix} \partial H_d / \partial q \\ \partial H_d / \partial p \end{bmatrix}$

여기서 $J_d$ 는 반대칭 인터커넥션 행렬, $R_d$ 는 양의 준정부호 댐핑 행렬, $H_d$ 는 원하는 에너지 함수이다. 이 조건을 만족하는 제어 입력 $u$ 의 결정은 매칭 방정식을 푸는 과정으로 귀결되며, 이로부터 에너지 형성과 댐핑 주입이 통일적으로 수행된다.

IDA-PBC(Passivity-Based Control)는 비선형 기계 시스템, 특히 부족구동(underactuated) 시스템의 안정화에서 매우 효과적이며, 이중 진자, 카트-진자, 아크로봇 등의 고전적 벤치마크 문제에 성공적으로 적용된다.

6. 통제된 라그랑지안 방법

블로흐(Bloch), 리어니(Leonard), 마던(Marsden) 등이 발전시킨 통제된 라그랑지안(controlled Lagrangian) 방법은 에너지 형성 제어를 라그랑주 정식화의 관점에서 접근한다. 이 방법은 폐루프 라그랑지안이 원하는 형태를 갖도록 입력을 설계하며, 해밀턴 정식화의 IDA-PBC와 본질적으로 동등한 결과를 제공한다.

두 접근의 동치성은 르장드르 변환을 통하여 보장되며, 어느 정식화를 선택하느냐는 문제의 구조와 해석의 편의성에 의존한다. 일반적으로 운동량 기반 분석이 자연스러운 경우 해밀턴 접근이, 가속도와 일반화 힘이 직접 다루어지는 경우 라그랑주 접근이 선호된다.

7. 부족구동 시스템과 매칭 조건

완전 구동(fully actuated) 시스템에서는 매칭 조건이 자동적으로 만족되며 임의의 폐루프 에너지 함수를 설계할 수 있다. 그러나 부족구동 시스템에서는 입력의 자유도가 자유도보다 작으므로 매칭 조건이 비자명한 편미분 방정식을 형성한다.

이 매칭 방정식의 해석적 해를 구하는 것은 일반적으로 어려우며, 시스템마다 특수한 형태의 해를 찾는 것이 연구의 주요 주제가 되어 왔다. 예를 들어, 카트-진자 시스템에서는 운동 에너지 형성을 통하여 안정화가 가능함이 보여졌으며, 회전 진자(furuta pendulum)와 비행체의 자세 제어에서도 유사한 분석이 수행되어 왔다.

8. 에너지 펌핑과 스윙업 제어

스윙업(swing-up) 제어는 안정 평형점이 아닌 불안정 평형점으로 시스템을 이동시키는 문제이다. 단진자의 위쪽 평형점으로의 스윙업이 대표적 예이다. 에너지 기반 접근에서는 시스템에 에너지를 점진적으로 주입하거나 제거하여 원하는 에너지 수준에 도달하게 하는 전략을 사용한다.

오스트롬(Åström)과 푸리오트(Furuta)가 제안한 단진자 스윙업 제어는 다음과 같은 형태를 띤다.

$\tau = k \, \text{sign}\left( (E - E^*) \dot{q} \right)$

여기서 $E$ 는 현재 에너지, $E^*$ 는 목표 에너지, $k > 0$ 은 이득이다. 이 제어 법칙은 매 순간 에너지를 목표 방향으로 변화시키며, 결과적으로 시스템은 점진적으로 원하는 에너지 수준에 수렴한다. 해밀턴 정식화의 명시적 에너지 표현이 이러한 직관적 제어 법칙의 설계를 가능하게 한다.

9. 매니퓰레이터의 임피던스 제어

임피던스 제어(impedance control)는 외부 환경과 상호작용하는 매니퓰레이터의 거동을 가상의 기계적 임피던스로 모사하는 제어 방법이다. 해밀턴 관점에서 이는 폐루프 시스템이 가상의 질량-스프링-댐퍼 시스템처럼 거동하도록 에너지 함수를 형성하는 것에 해당한다.

폐루프 에너지 함수를 다음과 같이 설계할 수 있다.

$H_d = \frac{1}{2} p^T M_d^{-1} p + \frac{1}{2} (x - x^*)^T K_d (x - x^*)$

여기서 $x$ 는 작업 공간 좌표, $K_d$ 는 가상의 강성 행렬, $M_d$ 는 가상의 관성 행렬이다. 이러한 폐루프 에너지를 구현하는 제어 토크가 임피던스 제어 법칙을 정의하며, 환경과의 안전한 상호작용을 가능하게 한다.

10. 수동성 기반 궤적 추종

평형점 안정화를 넘어 시간에 의존하는 기준 궤적 $q^d(t)$ 를 추종하는 문제도 수동성 관점에서 다룰 수 있다. 슬로틴(Slotine)과 리(Li)의 매니퓰레이터 적응 제어, 그리고 오르테가의 수동성 기반 추종 제어는 다음과 같은 보조 변수를 도입한다.

$s = \dot{q} - \dot{q}^d + \Lambda (q - q^d)$

이 변수의 동역학과 수동성 분석을 통하여 점근 추종이 보장된다. 해밀턴 형식주의에서 이러한 보조 변수는 가상의 운동량 오차로 해석되며, 폐루프 시스템의 에너지 함수의 구성과 자연스럽게 연결된다.

11. 본 절의 의의

본 절에서 다룬 에너지 기반 제어는 해밀턴 역학의 명시적 에너지 함수를 활용하여 비선형 기계 시스템을 견고하고 직관적으로 제어할 수 있는 방법론을 제공한다. 수동성, 에너지 형성, IDA-PBC, 통제된 라그랑지안 방법, 그리고 임피던스 제어는 모두 동일한 원리, 즉 폐루프 시스템의 에너지 함수와 댐핑 구조를 적절히 설계함으로써 안정성과 성능을 동시에 확보한다는 원리를 공유한다.

이러한 접근의 가장 큰 장점은 제어기의 안정성과 견고성이 에너지 함수의 구조로부터 직접 도출되므로, 모델 불확실성과 외란에 대하여 본질적으로 견고하다는 점이다. 또한 물리적 의미가 명료하므로 제어기의 거동을 직관적으로 해석하고 매개변수를 조정할 수 있다. 이러한 특성은 안전성과 신뢰성이 핵심적인 인간-로봇 상호작용, 의료 로봇, 협동 로봇 분야에서 특히 중요하다.

12. 학습 권장사항

본 절의 내용을 충분히 이해하기 위하여 라그랑주 및 해밀턴 정식화, 리아푸노프 안정성 이론, 그리고 비선형 시스템의 입출력 안정성 개념에 대한 선행 학습이 권장된다. 본 절의 내용을 심화 학습하기 위해서는 포트-해밀턴 시스템 이론, 디시패티비티(dissipativity) 이론, 그리고 비선형 적응 제어와 견고 제어에 대한 학습이 권장된다.

13. 참고 문헌

Ortega, R., Loría, A., Nicklasson, P. J., and Sira-Ramírez, H. (1998). Passivity-Based Control of Euler-Lagrange Systems. Springer.
Ortega, R., van der Schaft, A. J., Maschke, B., and Escobar, G. (2002). “Interconnection and Damping Assignment Passivity-Based Control of Port-Controlled Hamiltonian Systems.” Automatica, 38(4), 585–596.
van der Schaft, A. J. (2000). L2-Gain and Passivity Techniques in Nonlinear Control (2nd ed.). Springer.
Bloch, A. M., Leonard, N. E., and Marsden, J. E. (2000). “Controlled Lagrangians and the Stabilization of Mechanical Systems.” IEEE Transactions on Automatic Control, 45(12), 2253–2270.
Khalil, H. K. (2002). Nonlinear Systems (3rd ed.). Prentice Hall.
Spong, M. W., Hutchinson, S., and Vidyasagar, M. (2020). Robot Modeling and Control (2nd ed.). Wiley.
Åström, K. J., and Furuta, K. (2000). “Swinging up a Pendulum by Energy Control.” Automatica, 36(2), 287–295.

version: 1.0