17.41 최소자승법 기반 매개변수 추정

1. 개요

최소자승법(least squares)은 선형 회귀 구조를 가진 동역학 모델의 매개변수를 실험 데이터로부터 추정하는 가장 대표적이고 보편적인 방법이다. 로봇 동역학 방정식이 매개변수에 대해 선형이라는 성질 덕분에, 회귀자 행렬과 측정 토크 벡터의 관계가 고전적 선형 회귀 문제로 환원되며, 최소자승법은 이 문제의 해석적 해 또는 반복적 해를 효율적으로 제공한다. 본 절은 최소자승 추정의 수학적 정식화, 가중 최소자승, 총최소자승, 재귀 형태, 수치적 안정화, 정규화와 제약 추가, 그리고 물리적 타당성 확보 기법을 체계적으로 정리한다.

2. 회귀 모델의 구성

동역학 방정식을 샘플 k에서 측정 잡음과 함께 표현하면 다음과 같다.

\tau_k = Y(q_k,\dot{q}_k,\ddot{q}_k)\,\theta + \varepsilon_k

여기서 \tau_k는 측정 또는 추정된 관절 토크 벡터, Y_k는 상태의 회귀자, \theta는 매개변수 벡터, \varepsilon_k는 측정 잡음이다. 여러 샘플의 데이터를 쌓으면 다음과 같은 행렬 방정식이 얻어진다.

\mathbf{T} = \mathbf{Y}\,\theta + \boldsymbol{\varepsilon}

최소자승법은 잔차 \|\mathbf{T} - \mathbf{Y}\theta\|^2을 최소화하는 매개변수 추정치를 구하는 문제이다.

3. 보통 최소자승

해석적 해는 정규 방정식(normal equations)을 통해 주어진다.

\hat{\theta} = (\mathbf{Y}^\top \mathbf{Y})^{-1}\mathbf{Y}^\top \mathbf{T}

이 추정치는 잔차 제곱합을 최소화하며, 잡음이 평균 0이고 등분산 가우스 분포를 따를 때 최대 가능도 추정치와 일치한다. 그러나 이 방식은 \mathbf{Y}^\top \mathbf{Y}의 조건수가 크면 수치적으로 불안정하므로, 실제 구현에서는 QR 분해 또는 특이값 분해(SVD)를 이용하여 다음과 같이 계산한다.

\mathbf{Y} = \mathbf{Q}\mathbf{R},\quad \hat{\theta} = \mathbf{R}^{-1}\mathbf{Q}^\top \mathbf{T}

이 접근은 수치적 정확성과 안정성이 우수하여 식별 실무에서 표준적으로 사용된다.

4. 가중 최소자승

측정 잡음이 샘플마다 다르고 상관 구조가 알려진 경우, 가중 최소자승(weighted least squares)이 사용된다.

\hat{\theta} = (\mathbf{Y}^\top \mathbf{W}\mathbf{Y})^{-1}\mathbf{Y}^\top \mathbf{W}\mathbf{T}

여기서 \mathbf{W} = \mathrm{diag}(1/\sigma_k^2)는 잡음 분산의 역수로 구성된 대각 행렬이다. 각 샘플의 잡음 수준이 크게 다를 때, 가중 최소자승은 보통 최소자승보다 더 정밀한 추정치를 제공한다. 잡음 공분산이 비대각인 일반적 경우에는 \mathbf{W} = \mathbf{\Sigma}^{-1}로 정의되며, 이는 일반화 최소자승에 해당한다.

총최소자승

측정 오차가 종속 변수뿐 아니라 독립 변수 \mathbf{Y}에도 포함되는 경우(예컨대 속도와 가속도 계산에서의 수치 미분 오차), 총최소자승(total least squares, TLS) 기법이 사용된다. TLS는 \mathbf{Y}\mathbf{T}의 잔차를 동시에 최소화하며, 확장된 SVD를 통해 해가 얻어진다. 이 기법은 편향을 줄이는 데 유리하지만 구현과 해석이 다소 복잡하며, 로봇 식별에서는 수치 미분에 의한 오차가 큰 경우에 유용하다.

재귀 최소자승

식별 실험이 온라인으로 진행되거나 매개변수가 시간에 따라 변화하는 경우, 재귀 최소자승(recursive least squares, RLS)이 사용된다. 각 새로운 샘플 Y_k, \tau_k에 대해 매개변수와 공분산을 다음과 같이 갱신한다.

K_k = P_{k-1}Y_k^\top (Y_k P_{k-1}Y_k^\top + R_k)^{-1}

\hat{\theta}_k = \hat{\theta}_{k-1} + K_k(\tau_k - Y_k\hat{\theta}_{k-1})

P_k = (I - K_k Y_k)P_{k-1}

망각 계수 \lambda < 1을 도입하여 P_k = \lambda^{-1}(I - K_k Y_k)P_{k-1}의 형태로 쓰면 오래된 데이터의 영향을 점차 감소시킬 수 있으며, 이는 시변 매개변수 추정에 유용하다. RLS는 온라인 적응 제어, 온도 의존 마찰 갱신, 적재 변화 감지 등에 적용된다.

5. 수치적 안정화

회귀자 행렬의 조건수가 크면 수치적 오차가 증폭된다. 이를 완화하기 위해 Tikhonov 정규화가 사용된다.

\hat{\theta} = (\mathbf{Y}^\top\mathbf{Y} + \mu I)^{-1}\mathbf{Y}^\top \mathbf{T}

여기서 \mu > 0은 정규화 계수이며, 매개변수 추정의 편향을 약간 증가시키는 대신 분산을 크게 감소시킨다. 또한 스케일링 기법은 서로 다른 단위와 크기 범위의 매개변수를 가진 문제에서 조건수를 개선하는 데 효과적이다. 회귀자의 열을 정규화하면 공분산의 축별 비대칭성이 완화되어 수치 해법의 안정성이 향상된다.

물리적 타당성 제약과 제약 최소자승

무제약 최소자승 추정치는 물리적 타당성 조건을 만족하지 못하는 결과(예컨대 음의 질량, 비양정치 관성 텐서)를 낳을 수 있다. 이를 해결하기 위해 제약 최소자승 문제가 공식화된다.

\min_\theta \;\|\mathbf{Y}\theta - \mathbf{T}\|^2 \quad \text{subject to}\quad \theta \in \mathcal{P}

여기서 \mathcal{P}는 물리적 타당성 조건의 집합이다. Traversaro 등이 제안한 LMI 기반 표현은 이 문제를 반정치 계획(semidefinite programming, SDP) 또는 원뿔 최적화로 변환하여 볼록 최적화로 해결할 수 있게 한다. 이 접근은 식별된 매개변수가 항상 실제 강체의 관성 특성을 나타내도록 보장한다.

6. 잔차 분석과 모델 검증

추정된 매개변수의 품질은 잔차의 통계적 분석을 통해 평가된다. 대표적 지표는 정규화된 제곱 잔차의 분포, 잔차의 자기 상관, 잔차와 회귀자 사이의 상관성, 관절별 잔차 크기의 균일성 등이다. 잔차가 백색 잡음에 가깝다면 모델 구조가 적절하다는 증거가 되며, 잔차에 체계적 패턴이 존재한다면 모델 편향이나 미모델링 효과가 존재함을 시사한다. 이러한 분석은 모델 개선의 방향을 제시한다.

7. 베이즈 접근과 사전 지식

사전 지식이 있는 경우 베이즈 추정을 통해 매개변수의 사후 분포를 구할 수 있다.

\hat{\theta} = \arg\min_\theta \;\|\mathbf{Y}\theta - \mathbf{T}\|^2_{\mathbf{R}^{-1}} + \|\theta - \theta_0\|^2_{\mathbf{\Sigma}_0^{-1}}

여기서 \theta_0는 사전 평균, \mathbf{\Sigma}_0는 사전 공분산이다. 이 정식화는 Tikhonov 정규화의 일반화이며, CAD 기반 초기 추정치나 이전 식별 결과를 자연스럽게 반영한다.

본 절의 의의

본 절은 동역학 매개변수 식별의 표준 도구인 최소자승법을 체계적으로 제시한다. 보통 최소자승, 가중 최소자승, 총최소자승, 재귀 최소자승, 정규화, 제약 최적화, 잔차 분석, 베이즈 접근은 모두 로봇 식별 문제에서 서로 다른 상황에 적용되는 기법이며, 이들의 이해는 정확하고 신뢰할 수 있는 모델 구축에 필수적이다. 이러한 기반은 후속 절에서 다룰 매개변수 검증과 동역학 모델의 실시간 활용에 직접 연결된다.

학습 권장사항

독자는 2자유도 매니퓰레이터에 대해 시뮬레이션으로 생성된 데이터를 이용하여 최소자승 추정을 직접 구현하고, QR 분해 기반 해법과 정규 방정식 기반 해법의 수치적 차이를 비교해 볼 것을 권장한다. 또한 측정 잡음의 크기를 단계적으로 변화시키면서 추정 공분산의 변화를 관찰하고, Tikhonov 정규화가 과적합 방지에 미치는 영향을 분석하는 실습이 유익하다. 물리적 타당성 LMI 제약을 반영한 볼록 최적화 예제를 통해 제약 최소자승의 실무적 효용을 체험하기를 권한다.

참고 문헌

  • Khalil, W., & Dombre, E. (2002). Modeling, Identification and Control of Robots. Hermes Penton Science.
  • Swevers, J., Verdonck, W., & De Schutter, J. (2007). Dynamic model identification for industrial robots. IEEE Control Systems Magazine, 27(5), 58–71.
  • Ljung, L. (1999). System Identification: Theory for the User (2nd ed.). Prentice Hall.
  • Golub, G. H., & Van Loan, C. F. (2013). Matrix Computations (4th ed.). Johns Hopkins University Press.
  • Wensing, P. M., Kim, S., & Slotine, J.-J. E. (2018). Linear matrix inequalities for physically-consistent inertial parameter identification. IEEE Robotics and Automation Letters, 3(1), 60–67.
  • Gautier, M. (1997). Dynamic identification of robots with power model. IEEE International Conference on Robotics and Automation.
  • Haykin, S. (2002). Adaptive Filter Theory (4th ed.). Prentice Hall.

version: 1.0