11.24 리 군의 로봇 제어 응용

1. 리 군 기반 제어의 개요

리 군 기반 로봇 제어(Lie group-based robot control)는 강체 변환군 $SE(3)$ 이나 회전군 $SO(3)$ 과 같은 다양체 위에서 동작하는 제어 기법이다. 일반적인 유클리드 공간 기반 제어와 달리, 다양체 구조를 명시적으로 고려하여 자세나 강체 변환의 비선형성을 정확히 다룬다. 리 군 기반 제어는 자세 추적, 운동 동기화, 매니퓰레이터 작업 공간 제어, 무인 항공기 자세 안정화 등 회전과 강체 운동을 다루는 거의 모든 영역에서 핵심적이다. 이러한 접근법의 가장 큰 장점은 짐벌 락이나 매개변수 특이점이 없으며, 큰 자세 변화에서도 안정적으로 동작한다는 것이다.

2. 자세 제어의 일반 형태

2.1 문제 설정

자세 제어 문제는 다음과 같이 설정된다.

현재 자세: $\mathbf{R} \in SO(3)$
목표 자세: $\mathbf{R}_d \in SO(3)$
현재 각속도: $\boldsymbol{\omega} \in \mathbb{R}^3$
제어 입력: 토크 $\boldsymbol{\tau} \in \mathbb{R}^3$

목표는 자세 오차를 0으로 수렴시키는 토크를 결정하는 것이다.

2.2 자세 오차

자세 오차는 다음과 같이 정의된다.

$\mathbf{R}_e = \mathbf{R}_d^T\mathbf{R}$

이는 목표 자세에서 현재 자세로의 회전이며, 두 자세가 일치할 때 항등 행렬이다.

2.3 오차 벡터

자세 오차의 벡터 표현은 회전 행렬의 반대칭 부분이나 로그 사상으로 정의된다.

$\mathbf{e}_R = \frac{1}{2}(\mathbf{R}_d^T\mathbf{R} - \mathbf{R}^T\mathbf{R}_d)^\vee$

또는

$\mathbf{e}_R = \log(\mathbf{R}_d^T\mathbf{R})^\vee$

이 벡터가 비선형 제어 법칙의 기본 변수이다.

3. 비례-미분 자세 제어

3.1 기본 형태

가장 단순한 자세 제어 법칙은 PD 형태이다.

$\boldsymbol{\tau} = -\mathbf{K}_R\mathbf{e}_R - \mathbf{K}_\omega(\boldsymbol{\omega} - \boldsymbol{\omega}_d)$

여기서 $\mathbf{K}_R$ 과 $\mathbf{K}_\omega$ 는 양의 정부호 이득 행렬이다.

3.2 안정성

이 제어 법칙의 안정성은 리아푸노프 함수로 분석된다. 적절한 후보 함수가 양의 정부호이며, 폐루프 동역학 하에서 음의 정부호 미분을 가짐을 보인다.

3.3 거의 전역적 안정성

리 군 기반 자세 제어는 일반적으로 거의 전역적 점근 안정성(almost global asymptotic stability)을 보장한다. 이는 측도 0의 집합을 제외한 모든 초기 조건에서 점근 안정성을 의미한다.

4. 동역학 보상

4.1 비선형 보상

회전 동역학의 비선형 항을 보상하는 제어 법칙은 다음과 같다.

$\boldsymbol{\tau} = \boldsymbol{\omega} \times (\mathbf{J}\boldsymbol{\omega}) + \mathbf{J}(\dot{\boldsymbol{\omega}}_d - \mathbf{K}_R\mathbf{e}_R - \mathbf{K}_\omega\mathbf{e}_\omega)$

여기서

$\mathbf{J}$ : 본체의 회전 관성 텐서
$\boldsymbol{\omega} \times (\mathbf{J}\boldsymbol{\omega})$ : 자이로스코프 효과 보상
$\dot{\boldsymbol{\omega}}_d$ : 목표 각속도의 시간 미분(피드포워드)

4.2 입력-출력 선형화

이러한 보상이 폐루프 동역학을 선형화한다. 결과적으로 자세 오차의 동역학이 단순한 형태가 된다.

5. 기하학적 자세 추적 제어

5.1 Lee의 기하학적 제어

태욱 리 등이 제안한 기하학적 자세 추적 제어기는 회전군의 다양체 구조를 직접 활용한다.

$\boldsymbol{\tau} = -k_R\mathbf{e}_R - k_\Omega\mathbf{e}_\Omega + \boldsymbol{\omega} \times \mathbf{J}\boldsymbol{\omega} - \mathbf{J}([\boldsymbol{\omega}]_\times\mathbf{R}^T\mathbf{R}_d\boldsymbol{\omega}_d - \mathbf{R}^T\mathbf{R}_d\dot{\boldsymbol{\omega}}_d)$

여기서 $\mathbf{e}_\Omega = \boldsymbol{\omega} - \mathbf{R}^T\mathbf{R}_d\boldsymbol{\omega}_d$ 는 변환된 각속도 오차이다.

5.2 안정성 증명

이 제어기의 안정성은 리아푸노프 함수로 엄밀하게 증명된다.

$V = \frac{1}{2}\mathbf{e}_\Omega^T\mathbf{J}\mathbf{e}_\Omega + k_R\Psi(\mathbf{R}_d^T\mathbf{R})$

여기서 $\Psi(\mathbf{R}_e) = \frac{1}{2}\mathrm{tr}(\mathbf{I} - \mathbf{R}_e)$ 는 회전 오차의 측정값이다.

5.3 응용

기하학적 자세 추적 제어는 곡예 비행, 큰 자세 변화, 우주선 자세 제어 등에서 우수한 성능을 보인다.

6. $SE(3)$ 위의 추적 제어

6.1 결합된 위치-자세 제어

$SE(3)$ 위에서 위치와 자세를 동시에 제어하는 기법이다. 매니퓰레이터의 작업 공간 제어, 무인 항공기의 결합 제어 등에 사용된다.

6.2 위치 제어

위치 오차와 속도 오차로부터 목표 가속도가 결정된다.

$\mathbf{a}_d = -\mathbf{K}_p\mathbf{e}_x - \mathbf{K}_v\mathbf{e}_v + \ddot{\mathbf{x}}_d$

6.3 자세 결합

위치 제어의 결과(목표 추력 방향)가 자세 제어의 입력이 된다. 이는 무인 항공기의 계층적 제어 구조에서 일반적이다.

7. 매니퓰레이터의 작업 공간 제어

7.1 작업 공간 제어 법칙

매니퓰레이터의 작업 공간 제어는 말단 장치의 자세를 제어한다. PD 제어 법칙이 일반적이다.

$\mathcal{F}_e = -\mathbf{K}_p\mathbf{e}_T - \mathbf{K}_d\mathcal{V}$

여기서 $\mathbf{e}_T$ 는 자세 오차(위치 + 회전), $\mathcal{V}$ 는 현재 트위스트, $\mathcal{F}_e$ 는 명령 렌치이다.

7.2 자코비안을 통한 변환

작업 공간의 명령 렌치는 자코비안의 트랜스포즈를 통해 관절 토크로 변환된다.

$\boldsymbol{\tau} = \mathbf{J}^T(\boldsymbol{\theta})\mathcal{F}_e$

이는 작업 공간 제어의 표준 형태이다.

7.3 컴플라이언스 제어

매니퓰레이터의 컴플라이언스(compliance) 제어는 외부 힘에 대한 응답을 조절한다. 강성과 감쇠가 자세 다양체 위에서 정의된다.

8. 임피던스 제어

8.1 임피던스 모형

임피던스 제어(impedance control)는 매니퓰레이터의 동적 거동을 가상 임피던스 모형으로 형성한다.

$\mathbf{M}\dot{\mathcal{V}} + \mathbf{D}\mathcal{V} + \mathbf{K}\mathbf{e}_T = -\mathcal{F}_{\text{ext}}$

여기서

$\mathbf{M}$ : 가상 관성
$\mathbf{D}$ : 가상 감쇠
$\mathbf{K}$ : 가상 강성
$\mathcal{F}_{\text{ext}}$ : 외부 렌치

8.2 다양체 위의 표현

임피던스 모형의 자세 부분은 다양체 위에서 정의된다. 자세 오차가 리 대수의 원소로 표현된다.

8.3 응용

임피던스 제어는 인간-로봇 상호작용, 부품 조립, 표면 접촉 작업 등에서 활용된다.

9. 적응형 제어

9.1 매개변수 불확실성

매니퓰레이터의 동역학 매개변수(질량, 관성, 마찰 등)가 정확히 알려지지 않을 수 있다. 적응형 제어는 매개변수를 실시간으로 추정한다.

9.2 파라미터 갱신

추정된 매개변수가 운동 중 갱신된다. 일반적으로 추적 오차가 0이 되도록 매개변수가 조정된다.

9.3 안정성 보장

리아푸노프 분석을 통해 적응 알고리즘의 안정성과 수렴이 증명된다. 다양체 구조가 고려된다.

10. 슬라이딩 모드 제어

10.1 슬라이딩 면

슬라이딩 모드 제어(sliding mode control)는 슬라이딩 면을 정의하고, 시스템 상태가 이 면을 따라가도록 한다.

$\mathbf{s} = \mathbf{e}_\omega + \mathbf{\Lambda}\mathbf{e}_R$

여기서 $\mathbf{\Lambda}$ 는 양의 정부호 행렬이다.

10.2 제어 법칙

제어 법칙은 슬라이딩 면을 0으로 유도하도록 설계된다.

$\boldsymbol{\tau} = \boldsymbol{\omega} \times (\mathbf{J}\boldsymbol{\omega}) - \mathbf{J}\mathbf{\Lambda}\dot{\mathbf{e}}_R - \mathbf{K}_s\mathrm{sgn}(\mathbf{s})$

부호 함수가 외란에 대한 강건성을 제공한다.

10.3 채터링

부호 함수의 불연속성이 고주파 진동(채터링)을 발생시킬 수 있다. 매끄러운 근사(예: 사인 함수)가 사용된다.

11. 백스테핑 제어

11.1 단계별 설계

백스테핑(backstepping) 제어는 시스템을 단계별로 분해하고 각 단계마다 가상 제어 입력을 설계한다. 최종적으로 실제 제어 입력이 결정된다.

11.2 다양체 위의 백스테핑

자세 제어의 백스테핑은 자세 오차와 각속도 오차의 두 단계로 이루어진다. 각 단계의 안정성이 리아푸노프 분석으로 증명된다.

11.3 응용

백스테핑 제어는 무인 항공기, 매니퓰레이터, 모바일 로봇 등에서 사용된다. 비선형성이 강한 시스템에 적합하다.

12. 무인 항공기의 자세 제어

12.1 쿼드콥터의 자세 제어

쿼드콥터의 자세 제어는 PID 또는 더 고급 비선형 제어 기법을 사용한다. 자세는 쿼터니언 또는 회전 행렬로 표현된다.

12.2 가속도-자세 변환

위치 제어의 결과(목표 가속도)가 자세 제어의 입력으로 변환된다. 이 변환은 추력 방향이 본체 z축과 일치하도록 한다.

12.3 곡예 비행

곡예 비행에서는 큰 자세 변화가 발생한다. 리 군 기반 제어가 짐벌 락 없이 동작한다.

13. 우주선 자세 제어

13.1 자세 결정과 제어

우주선의 자세 결정과 제어는 우주공학의 중요한 분야이다. 단위 쿼터니언이나 회전 행렬이 자세 표현으로 사용된다.

13.2 자세 매니퓰레이션

위성의 자세 매니퓰레이션은 큰 회전(예: 통신 안테나의 정렬)을 포함한다. 리 군 기반 제어가 이러한 큰 변화에서도 정확하다.

13.3 운동량 휠과 추력기

자세 제어의 액추에이터로 운동량 휠과 추력기가 사용된다. 각 액추에이터의 한계와 효율성이 고려된다.

14. 동기화 제어

14.1 다중 시스템의 동기화

여러 강체의 자세를 동기화하는 제어 문제이다. 다중 무인 항공기의 편대 비행, 분산 위성의 자세 동기화 등에서 등장한다.

14.2 합의 알고리즘

합의 알고리즘(consensus algorithm)은 분산 시스템의 동기화를 다룬다. 다양체 위에서의 합의는 리 군 이론을 활용한다.

14.3 응용

군집 로봇, 협동 매니퓰레이터, 분산 위성 등에서 동기화 제어가 활용된다.

15. 학습 기반 제어

15.1 강화 학습

강화 학습은 자세 제어를 위한 정책을 학습한다. 자세 표현에 다양체 구조가 고려된다.

15.2 모방 학습

전문가의 시범으로부터 제어 정책을 학습하는 방법이다. 자세 데이터가 다양체 위에서 처리된다.

15.3 학습과 모형 기반의 결합

학습 정책과 모형 기반 제어를 결합한 하이브리드 접근법이 효과적이다. 안정성 보장과 적응성을 동시에 제공한다.

16. 견고 제어

16.1 외란과 모형 불확실성

실제 시스템에는 외란과 모형 불확실성이 있다. 견고 제어(robust control)는 이러한 영향에 강건한 제어를 설계한다.

16.2 $H_\infty$ 제어

$H_\infty$ 제어는 외란의 영향을 최소화하는 제어를 설계한다. 자세 제어에 적용될 수 있다.

16.3 다양체 위의 견고 제어

다양체 위의 견고 제어는 활발한 연구 분야이다. 회전군과 강체 변환군의 구조가 활용된다.

17. 모델 예측 제어 (MPC)

17.1 MPC의 개념

모델 예측 제어(Model Predictive Control)는 미래 상태를 예측하고 비용을 최소화하는 최적 제어 입력을 계산한다.

17.2 다양체 위의 MPC

자세 변수의 경우 MPC도 다양체 위에서 동작한다. 매개변수화와 최적화에 리 군 이론이 활용된다.

17.3 응용

MPC는 자율 주행, 드론 제어, 매니퓰레이터 제어 등에서 광범위하게 사용된다.

18. 최적 제어

18.1 LQR

선형 이차 조절기(LQR)는 선형 시스템의 표준 최적 제어 방법이다. 자세 제어의 선형화 모형에 적용될 수 있다.

18.2 LQG

선형 이차 가우스(LQG) 제어는 LQR과 칼만 필터를 결합한다. 잡음이 있는 환경에서 사용된다.

18.3 iLQR

iLQR(iterative LQR)은 비선형 시스템의 최적 제어를 위한 반복 알고리즘이다. 자세 변수의 경우 다양체 구조가 고려된다.

19. 자세 제어의 매개변수 튜닝

19.1 이득 선택

PD 또는 PID 제어의 이득은 시스템 동특성에 맞춰 선택된다. 고유 진동수와 감쇠비가 결정된다.

19.2 자동 튜닝

자동 튜닝(autotuning) 알고리즘은 시스템 식별을 통해 최적 이득을 찾는다.

19.3 안정성 마진

이득 선택은 안정성 마진(stability margin)을 고려한다. 너무 큰 이득은 진동을, 너무 작은 이득은 느린 응답을 유발한다.

20. 응용 분야

20.1 산업 매니퓰레이터

산업 매니퓰레이터의 작업 공간 제어, 컴플라이언스 제어, 임피던스 제어 등에서 리 군 기반 제어가 사용된다.

20.2 협동 로봇

협동 로봇(코봇)에서 인간과의 안전한 상호작용을 위한 자세 제어가 필요하다.

20.3 의료 로봇

수술 로봇, 재활 로봇 등에서 정밀한 자세 제어가 필수이다.

20.4 가상 현실

VR 컨트롤러와 머리 추적기의 자세 추정과 제어에서 리 군 이론이 활용된다.

20.5 모션 캡처

모션 캡처 시스템에서 인체 부위의 자세를 추정하고 제어한다.

21. 학습의 가치

리 군 기반 로봇 제어를 깊이 이해하는 것은 다음과 같은 이점을 제공한다.

자세 제어의 이론적 기반을 깊이 이해할 수 있다.
다양한 로봇 시스템의 제어를 통합적으로 다룰 수 있다.
짐벌 락 없는 강건한 제어가 가능하다.
학술 문헌의 표준 알고리즘을 이해할 수 있다.
실제 시스템의 성능을 향상시킬 수 있다.

22. 응용 예시: 매니퓰레이터의 작업 공간 제어

산업 매니퓰레이터가 부품을 조립하는 작업에서 말단 장치의 자세가 정밀하게 제어된다. 리 군 기반 제어 법칙이 자코비안을 통해 관절 토크로 변환된다.

23. 응용 예시: 드론의 자세 제어

쿼드콥터 드론의 자세 제어에서 PD 또는 기하학적 제어가 사용된다. 큰 자세 변화에서도 안정적으로 동작한다.

24. 응용 예시: 위성의 자세 제어

위성이 임무를 수행하기 위해 특정 방향으로 회전한다. 단위 쿼터니언 기반 제어가 큰 자세 변화를 처리한다.

25. 응용 예시: 인간형 로봇의 균형 제어

이족 인간형 로봇의 균형은 본체 자세의 정밀한 제어에 의존한다. 리 군 기반 제어가 다양한 자세에서 동작한다.

26. 응용 예시: 자율 주행 차량의 운동 제어

자율 주행 차량의 운동 제어에서 차량의 자세가 $SE(2)$ 의 원소로 표현된다. 비홀로노믹 제약이 고려된다.

27. 미래의 발전

27.1 학습과의 결합

학습 기반 방법과 모형 기반 제어의 결합이 활발히 연구되고 있다. 안정성 보장과 적응성을 동시에 제공한다.

27.2 안전 보장

형식적 검증과 안전성 보장이 중요해지고 있다. 다양체 위의 안전 제어가 발전하고 있다.

27.3 분산 제어

다중 로봇 시스템의 분산 제어가 발전하고 있다. 분산 합의와 동기화가 핵심이다.

27.4 미분 가능 제어

미분 가능 제어는 학습 시스템과의 통합을 가능하게 한다. 리 군 위의 자동 미분이 활용된다.

28. 참고 문헌

Lee, T., Leok, M., & McClamroch, N. H. (2010). “Geometric tracking control of a quadrotor UAV on SE(3).” IEEE Conference on Decision and Control, 5420–5425.
Wie, B., & Barba, P. M. (1985). “Quaternion feedback for spacecraft large angle maneuvers.” Journal of Guidance, Control, and Dynamics, 8(3), 360–365.
Bullo, F., & Murray, R. M. (1999). “Tracking for fully actuated mechanical systems: A geometric framework.” Automatica, 35(1), 17–34.
Sastry, S. (1999). Nonlinear Systems: Analysis, Stability, and Control. Springer.
Khalil, H. K. (2002). Nonlinear Systems (3rd ed.). Prentice Hall.
Chung, S. J., & Slotine, J. J. E. (2009). “Cooperative robot control and concurrent synchronization of Lagrangian systems.” IEEE Transactions on Robotics, 25(3), 686–700.

version: 1.0