10.61 자세 오차 기반 피드백 제어기 설계

1. 피드백 제어의 개요

자세 피드백 제어는 현재 자세와 목표 자세의 차이(자세 오차)를 사용하여 제어 입력(토크 또는 각속도)을 생성하는 기법이다. 이는 우주선, 로봇 매니퓰레이터, 드론 등 모든 자세 제어 시스템의 기반이다.

본 절에서는 자세 오차 기반 피드백 제어기의 설계 원리와 구체적 예시를 다룬다.

2. 피드백 제어의 기본 원리

2.1 제어의 목표

자세 제어의 목표는 현재 자세 $\mathbf{R}$ (또는 $\mathbf{q}$ )을 목표 자세 $\mathbf{R}_d$ 로 수렴시키는 것이다. 동시에 각속도 $\boldsymbol{\omega}$ 가 목표 각속도 $\boldsymbol{\omega}_d$ 로 수렴해야 한다.

2.2 제어 입력

제어 입력은 일반적으로 관절 토크 또는 각속도 명령이다.

토크 제어: 직접 토크를 생성
속도 제어: 각속도 명령을 생성

2.3 피드백 루프

센서가 현재 자세를 측정하고, 제어기가 오차를 계산하여 제어 입력을 생성하고, 액추에이터가 이를 실행한다. 이 루프가 빠르게 반복되어 자세가 수렴한다.

3. 쿼터니언 기반 PD 제어

가장 간단하고 일반적인 자세 제어기는 PD (비례 미분) 제어이다.

3.1 제어 법칙

$\boldsymbol{\tau} = -k_p\mathbf{q}_{e,v} - k_d(\boldsymbol{\omega} - \boldsymbol{\omega}_d)$

여기서

$\mathbf{q}_{e,v}$ : 쿼터니언 오차의 벡터 부분
$k_p$ : 비례 이득 ( $> 0$ )
$k_d$ : 미분 이득 ( $> 0$ )
$\boldsymbol{\omega}, \boldsymbol{\omega}_d$ : 현재와 목표 각속도

3.2 부호 보정

쿼터니언 오차의 부호를 보정하여 짧은 경로 회전을 선택한다.

q_error = compute_error(q_current, q_desired)
if q_error.w < 0:
    q_error = -q_error
tau = -k_p * q_error.vec() - k_d * (omega - omega_d)

3.3 설명

$k_p$ 는 오차의 크기에 비례하는 복원 토크를 생성한다. $k_d$ 는 각속도의 크기에 비례하는 감쇠 토크를 생성한다. 두 항의 결합이 자세를 목표로 안정적으로 수렴시킨다.

4. 안정성 증명

PD 제어기의 안정성을 리아프노프 방법으로 증명할 수 있다.

4.1 리아프노프 함수

$V = 2k_p(1 - \lvert q_{e,w}\rvert) + \frac{1}{2}\boldsymbol{\omega}_e^T\mathbf{J}\boldsymbol{\omega}_e$

여기서 $\mathbf{J}$ 는 관성 텐서, $\boldsymbol{\omega}_e = \boldsymbol{\omega} - \boldsymbol{\omega}_d$ 이다.

4.2 양정치성

$V \geq 0$
$V = 0$ iff $\mathbf{q}_e = \pm 1$ (항등 회전) and $\boldsymbol{\omega}_e = \mathbf{0}$

4.3 시간 미분

$\dot{V} = -k_d\lVert\boldsymbol{\omega}_e\rVert^2$

$\dot{V} \leq 0$ 이며, 이는 시스템이 점근적으로 안정임을 보인다.

4.4 결론

$k_p > 0$ , $k_d > 0$ 으로 시스템이 목표 자세와 각속도로 수렴한다.

5. 피드 포워드 항

동적 시스템에서 피드 포워드 항을 추가하여 추적 성능을 향상시킨다.

5.1 전체 제어 법칙

$\boldsymbol{\tau} = -k_p\mathbf{q}_{e,v} - k_d\boldsymbol{\omega}_e + \mathbf{J}\dot{\boldsymbol{\omega}}_d + \boldsymbol{\omega}\times\mathbf{J}\boldsymbol{\omega}$

5.2 각 항의 의미

$-k_p\mathbf{q}_{e,v}$ : 비례 피드백
$-k_d\boldsymbol{\omega}_e$ : 미분 피드백
$\mathbf{J}\dot{\boldsymbol{\omega}}_d$ : 피드 포워드 (목표 가속도)
$\boldsymbol{\omega}\times\mathbf{J}\boldsymbol{\omega}$ : 코리올리/원심력 보상 (자이로 항)

5.3 장점

피드 포워드 항은 목표 궤적의 동적 요구사항을 직접 반영한다. 이는 추적 오차를 감소시킨다.

6. MRP 기반 제어

수정 로드리게스 매개변수(MRP)를 사용한 자세 제어도 가능하다.

6.1 제어 법칙

$\boldsymbol{\tau} = -k_p\boldsymbol{\sigma}_e - k_d\boldsymbol{\omega}_e$

여기서 $\boldsymbol{\sigma}_e$ 는 MRP 오차이다.

6.2 특성

쿼터니언과 구조는 같음
MRP의 자유 매개변수 특성 활용
우주 항공에서 주로 사용

7. 회전 행렬 기반 제어

회전 행렬로부터 직접 오차 벡터를 추출하여 제어할 수 있다.

7.1 오차 벡터

$\mathbf{e}_R = \frac{1}{2}(\mathbf{R}_e - \mathbf{R}_e^T)^\vee$

여기서 $(\cdot)^\vee$ 는 반대칭 행렬에서 벡터로의 사상이다. 이는 쿼터니언의 벡터 부분과 같다.

7.2 제어 법칙

$\boldsymbol{\tau} = -k_p\mathbf{e}_R - k_d\boldsymbol{\omega}_e$

이는 쿼터니언 기반 제어와 등가이다.

8. 비선형 자세 제어

작은 오차에 대한 선형 제어 외에 비선형 제어 기법도 사용된다.

8.1 피드백 선형화

비선형 자세 동역학을 피드백 선형화하여 선형 시스템으로 변환한다. 그 후 선형 제어 이론을 적용한다.

8.2 슬라이딩 모드 제어

슬라이딩 모드 제어는 강건 제어 기법이다. 슬라이딩 표면을 자세 오차와 각속도 오차의 결합으로 정의한다.

$\mathbf{s} = \boldsymbol{\omega}_e + k\mathbf{q}_{e,v}$

제어 입력은 슬라이딩 표면을 0으로 만드는 방향이다.

8.3 백스테핑 제어

백스테핑(backstepping) 기법은 비선형 시스템에 대한 계층적 제어 설계이다. 자세와 각속도를 단계적으로 제어한다.

8.4 최적 제어

LQR, LQG 등의 최적 제어 기법을 선형화된 자세 동역학에 적용할 수 있다.

9. 지속적 회전 방지

자세 제어에서 의도하지 않은 지속적 회전(spin)을 방지해야 한다.

9.1 부호 선택

쿼터니언 오차의 부호를 짧은 경로를 선택하도록 보정한다.

if q_error.w < 0:
    q_error = -q_error

이는 $360°$ 이상의 불필요한 회전을 피한다.

9.2 각속도 제한

제어 입력의 크기를 제한하여 과도한 각속도를 방지한다.

10. 외란 보상

외란(disturbance)이 있는 시스템에서 추가 기법이 필요하다.

10.1 외란 관측기

외란을 관측하여 피드 포워드로 보상한다.

$\boldsymbol{\tau} = \boldsymbol{\tau}_{\text{nominal}} - \hat{\boldsymbol{d}}$

여기서 $\hat{\boldsymbol{d}}$ 는 추정된 외란이다.

10.2 적응 제어

시스템 매개변수가 불확실한 경우 적응 제어를 사용한다. 제어기가 시스템을 관측하면서 매개변수를 추정하고 이에 따라 제어 입력을 조정한다.

10.3 강건 제어

외란에 강건한 제어기를 설계한다. $H_\infty$ 제어, 슬라이딩 모드 등이 예이다.

11. 실제 시스템의 고려사항

11.1 포화

실제 액추에이터는 최대 토크 제한이 있다. 제어 입력을 포화시키는 기법이 필요하다.

tau = clip(tau, -tau_max, tau_max)

11.2 적분 와인드업

적분기를 사용하는 PID 제어에서 포화로 인한 적분 와인드업을 방지해야 한다.

11.3 잡음

센서 잡음이 제어에 영향을 준다. 필터링과 적절한 이득 선택이 필요하다.

11.4 이산 시간 구현

연속 시간 제어 법칙을 이산 시간으로 구현한다. 샘플링 주기의 선택이 중요하다.

11.5 지연

센서와 액추에이터의 지연이 안정성에 영향을 준다. 예측 기법으로 보상할 수 있다.

12. 제어기 이득 튜닝

제어기 이득 $k_p$ 와 $k_d$ 의 선택이 성능을 결정한다.

12.1 수동 튜닝

시행착오로 이득을 조정한다. 응답을 관측하면서 조정한다.

$k_p$ 가 너무 작으면: 느린 응답
$k_p$ 가 너무 크면: 과도한 오버슈트
$k_d$ 가 너무 작으면: 진동
$k_d$ 가 너무 크면: 느린 감쇠

12.2 해석적 방법

선형 시스템 이론으로 이득을 계산한다. 원하는 감쇠비와 고유 주파수로부터

$k_p = \omega_n^2, \quad k_d = 2\zeta\omega_n$

여기서 $\omega_n$ 은 고유 주파수, $\zeta$ 는 감쇠비이다.

12.3 최적 제어

LQR을 사용하여 최적 이득을 계산한다. 이는 비용 함수를 최소화하는 이득이다.

12.4 적응 튜닝

시스템의 성능을 관측하면서 이득을 실시간으로 조정한다.

13. 응용 사례

13.1 쿼드로터 자세 제어

드론의 자세(롤, 피치, 요)를 제어한다. 쿼터니언 기반 PD 제어가 표준이다.

13.2 매니퓰레이터 말단 장치

매니퓰레이터의 말단 장치 자세를 목표 자세로 수렴시킨다. 역기구학과 결합된다.

13.3 우주선 자세 제어

우주선이 태양, 지구, 별 등의 목표로 자세를 정렬한다. MRP 또는 쿼터니언 기반 제어가 사용된다.

13.4 짐벌 카메라

카메라를 안정적인 방향으로 유지하는 짐벌 시스템. 작은 자세 오차를 빠르게 보정한다.

13.5 관성 추진 시스템

위성의 관성 추진 시스템에서 자세 제어가 필수이다. 정밀한 제어가 요구된다.

14. 카르테시안 공간 제어

매니퓰레이터의 말단 장치 자세 제어는 카르테시안 공간에서 정의되며, 관절 공간으로 변환된다.

14.1 카르테시안 제어 법칙

$\boldsymbol{\tau}_{\text{cart}} = -k_p\mathbf{q}_{e,v} - k_d\boldsymbol{\omega}_e$

14.2 관절 토크로의 변환

자코비안의 전치를 사용한다.

$\boldsymbol{\tau}_{\text{joint}} = \mathbf{J}^T\boldsymbol{\tau}_{\text{cart}}$

여기서 $\mathbf{J}$ 는 매니퓰레이터의 자코비안이다.

15. 성능 평가

자세 제어기의 성능은 다음의 지표로 평가된다.

15.1 안정성

시스템이 수렴하는지 확인한다.

15.2 응답 시간

목표에 도달하는 시간이다.

15.3 오버슈트

목표를 초과하는 정도이다.

15.4 정상 상태 오차

목표와 최종 자세의 차이이다.

15.5 외란 거부

외란에 대한 반응이다.

이러한 지표를 개선하기 위해 이득 튜닝과 제어 기법 개선이 이루어진다.

16. 멀티레이트 제어

자세 제어는 일반적으로 빠른 루프와 느린 루프로 구성된다.

16.1 내부 루프 (빠름)

각속도 제어. 매우 빠른 샘플링 주기 ( $1000$ Hz 이상).

16.2 외부 루프 (느림)

자세 제어. 내부 루프가 충분히 빠르면 외부 루프는 더 느려도 된다 ( $100-500$ Hz).

16.3 계층적 설계

이러한 계층적 구조는 자세 제어기 설계를 단순화한다.

17. 센서 융합과 자세 제어

자세 제어기는 센서 융합으로 추정된 자세를 입력으로 받는다.

17.1 센서

자이로스코프: 각속도 측정
가속도계: 중력 방향 측정
자력계: 지자기 방향 측정
카메라/GPS: 절대 자세 참조

17.2 융합

칼만 필터 등으로 여러 센서를 융합하여 정확한 자세를 추정한다. 이 추정값이 제어기에 입력된다.

18. 결론

자세 오차 기반 피드백 제어는 우주선, 로봇 매니퓰레이터, 드론 등의 자세 제어 시스템의 기본 기법이다. PD 제어가 가장 일반적이며, 쿼터니언의 벡터 부분을 오차로 사용한다. 리아프노프 방법으로 안정성을 증명할 수 있고, 피드 포워드 항과 외란 보상을 추가하여 성능을 향상시킬 수 있다. 비선형 기법(슬라이딩 모드, 백스테핑 등)은 더 복잡한 상황에서 사용된다. 제어기 설계는 응용의 요구에 따라 적절한 기법과 이득을 선택하는 작업이다.

19. 참고 문헌

Wen, J. T., & Kreutz-Delgado, K. (1991). “The Attitude Control Problem.” IEEE Transactions on Automatic Control, 36(10), 1148–1162.
Wie, B. (2008). Space Vehicle Dynamics and Control (2nd ed.). AIAA Education Series.
Sidi, M. J. (1997). Spacecraft Dynamics and Control. Cambridge University Press.
Markley, F. L., & Crassidis, J. L. (2014). Fundamentals of Spacecraft Attitude Determination and Control. Springer.
Siciliano, B., Sciavicco, L., Villani, L., & Oriolo, G. (2009). Robotics: Modelling, Planning and Control. Springer.

version: 1.0