11.10 베이커-캠벨-하우스도르프(BCH) 공식

1. BCH 공식의 개요

베이커-캠벨-하우스도르프(Baker-Campbell-Hausdorff, BCH) 공식은 비가환 리 군에서 두 지수의 곱이 어떻게 다시 단일 지수로 표현되는지를 기술하는 공식이다. 가환 리 군에서는 $e^Xe^Y = e^{X+Y}$ 가 성립하지만, 비가환 리 군에서는 이 단순한 관계가 성립하지 않으며, 두 원소의 리 괄호와 그 중첩 형태들이 보정 항으로 등장한다. BCH 공식은 리 군 이론의 핵심이며, 자세 추정의 갱신, 비선형 최적화, 매니퓰레이터 운동학 등 로봇공학의 다양한 영역에서 활용된다.

2. 가환과 비가환의 차이

2.1 가환 경우

스칼라 또는 가환 리 군에서 지수 함수는 다음의 단순한 성질을 가진다.

$e^xe^y = e^{x+y}$

이는 일반적인 지수 함수에서 익숙한 식이다.

2.2 비가환의 일반적 형태

행렬과 같은 비가환 대상에서는 일반적으로

$e^Xe^Y \neq e^{X+Y}$

두 행렬이 가환적이지 않으면, 두 지수의 곱이 단순한 합의 지수가 아니다. 차이는 두 행렬의 비가환성, 즉 교환자에 의해 결정된다.

3. BCH 공식의 형태

3.1 일반 형태

BCH 공식은 다음과 같이 표현된다.

$\log(\exp(X)\exp(Y)) = X + Y + \frac{1}{2}[X, Y] + \frac{1}{12}[X, [X, Y]] - \frac{1}{12}[Y, [X, Y]] - \frac{1}{24}[Y, [X, [X, Y]]] + \ldots$

이는 무한 급수이며, 모든 항이 $X$ , $Y$ 의 리 괄호의 중첩 형태이다.

3.2 동치 표현

다른 형태로 다음과 같이도 표현된다.

$\exp(X)\exp(Y) = \exp(Z)$

여기서

$Z = X + Y + \frac{1}{2}[X, Y] + \frac{1}{12}([X, [X, Y]] - [Y, [X, Y]]) + \ldots$

3.3 처음 몇 항

BCH 공식의 처음 몇 항을 차수별로 정리하면 다음과 같다.

1차: $X + Y$
2차: $\frac{1}{2}[X, Y]$
3차: $\frac{1}{12}([X, [X, Y]] - [Y, [X, Y]])$
4차: $-\frac{1}{24}[Y, [X, [X, Y]]]$

이러한 항들은 모두 리 괄호의 중첩 형태이며, $X$ 와 $Y$ 의 비가환성을 반영한다.

4. BCH 공식의 의미

4.1 리 군의 곱 구조

BCH 공식은 리 군의 곱 구조를 리 대수의 언어로 완전히 기술한다. 두 리 군 원소의 곱이 리 대수에서 어떻게 표현되는지를 보여준다.

4.2 비가환성의 정량화

리 괄호 항들이 두 원소의 비가환 정도를 정량화한다. 두 원소가 가환적이면 모든 리 괄호가 0이고, BCH 공식은 단순한 합으로 환원된다.

4.3 차 근사

작은 $X$ 와 $Y$ 에 대해서는 1차 근사가 사용된다.

$\exp(X)\exp(Y) \approx \exp(X + Y)$

이 근사는 무한소 운동에 대해 유효하며, 자세 추정의 미소 갱신에서 활용된다.

4.4 차 근사

더 정확한 근사는 2차 항을 포함한다.

$\exp(X)\exp(Y) \approx \exp\!\left(X + Y + \frac{1}{2}[X, Y]\right)$

이는 작지만 무시할 수 없는 비가환성을 다루는 데 사용된다.

5. $\mathfrak{so}(3)$ 에서의 BCH 공식

5.1 차원 회전의 합성

두 회전 $\exp([\boldsymbol{\omega}_1]_\times)$ 와 $\exp([\boldsymbol{\omega}_2]_\times)$ 의 곱을 단일 회전으로 표현하면

$\exp([\boldsymbol{\omega}_1]_\times)\exp([\boldsymbol{\omega}_2]_\times) = \exp([\boldsymbol{\omega}_3]_\times)$

여기서 $\boldsymbol{\omega}_3$ 는 BCH 공식으로 다음과 같이 표현된다.

$\boldsymbol{\omega}_3 = \boldsymbol{\omega}_1 + \boldsymbol{\omega}_2 + \frac{1}{2}\boldsymbol{\omega}_1 \times \boldsymbol{\omega}_2 + \frac{1}{12}\boldsymbol{\omega}_1 \times (\boldsymbol{\omega}_1 \times \boldsymbol{\omega}_2) - \frac{1}{12}\boldsymbol{\omega}_2 \times (\boldsymbol{\omega}_1 \times \boldsymbol{\omega}_2) + \ldots$

여기서 $\mathfrak{so}(3)$ 의 리 괄호가 외적임을 사용하였다.

5.2 작은 회전의 1차 근사

작은 회전에 대해서는

$\boldsymbol{\omega}_3 \approx \boldsymbol{\omega}_1 + \boldsymbol{\omega}_2$

이는 미소 회전이 가환적임을 의미한다.

5.3 작은 회전의 2차 근사

더 정확한 근사는

$\boldsymbol{\omega}_3 \approx \boldsymbol{\omega}_1 + \boldsymbol{\omega}_2 + \frac{1}{2}\boldsymbol{\omega}_1 \times \boldsymbol{\omega}_2$

이는 두 회전의 비가환성을 1차 보정으로 반영한다.

6. $\mathfrak{se}(3)$ 에서의 BCH 공식

6.1 트위스트의 합성

두 트위스트의 지수의 곱은 단일 트위스트의 지수로 표현된다.

$\exp(\hat{\boldsymbol{\xi}}_1)\exp(\hat{\boldsymbol{\xi}}_2) = \exp(\hat{\boldsymbol{\xi}}_3)$

$\boldsymbol{\xi}_3$ 의 BCH 공식은 다음과 같다.

$\boldsymbol{\xi}_3 = \boldsymbol{\xi}_1 + \boldsymbol{\xi}_2 + \frac{1}{2}[\boldsymbol{\xi}_1, \boldsymbol{\xi}_2]_{\mathfrak{se}(3)} + \frac{1}{12}([\boldsymbol{\xi}_1, [\boldsymbol{\xi}_1, \boldsymbol{\xi}_2]] - [\boldsymbol{\xi}_2, [\boldsymbol{\xi}_1, \boldsymbol{\xi}_2]]) + \ldots$

여기서 $\mathfrak{se}(3)$ 의 리 괄호는 6차원 벡터 형태로 표현된다.

6.2 명시적 형태

$\mathfrak{se}(3)$ 의 리 괄호는 다음과 같이 계산된다.

$[\boldsymbol{\xi}_1, \boldsymbol{\xi}_2] = \begin{bmatrix}\boldsymbol{\omega}_1 \times \boldsymbol{\omega}_2 \\ \boldsymbol{\omega}_1 \times \mathbf{v}_2 - \boldsymbol{\omega}_2 \times \mathbf{v}_1\end{bmatrix}$

이를 BCH 공식에 대입하면 강체 변환의 결합 트위스트를 계산할 수 있다.

7. BCH 공식의 유도

7.1 동기

BCH 공식의 유도는 다양한 방법으로 가능하다. 가장 직관적인 방법 중 하나는 다음의 동치 조건을 만족하는 $Z(t)$ 를 찾는 것이다.

$e^{tX}e^{tY} = e^{Z(t)}$

$Z(t)$ 의 시간 미분 방정식을 세우고, $t = 0$ 에서 시작하여 거듭제곱 급수로 풀면 BCH 공식이 얻어진다.

7.2 Dynkin의 공식

Dynkin은 BCH 공식의 명시적 형태를 다음과 같이 제시하였다.

$Z = \sum_{n=1}^{\infty}\frac{(-1)^{n-1}}{n}\sum_{r_i + s_i > 0}\frac{[X^{r_1}Y^{s_1}\cdots X^{r_n}Y^{s_n}]}{(\sum_{i=1}^n(r_i + s_i))(\prod_{i=1}^n r_i!s_i!)}$

이는 모든 차수의 리 괄호 중첩을 명시적으로 나타낸다. 다만 실용적 계산에서는 처음 몇 항만 사용된다.

8. BCH 공식의 수렴

8.1 수렴 조건

BCH 공식의 무한 급수는 일반적으로 작은 인수에 대해서만 수렴한다. 정확한 수렴 영역은 리 군의 구조에 의존한다.

8.2 행렬 노름 조건

행렬 리 군에서 BCH 공식은 다음 조건을 만족할 때 수렴한다.

$\lVert X\rVert + \lVert Y\rVert < \log 2$

이는 충분 조건이며, 더 큰 인수에 대해서도 수렴할 수 있다.

8.3 발산의 의미

큰 인수에 대해 BCH 공식이 발산하더라도, 두 지수의 곱 자체는 잘 정의된다. 이는 BCH 공식이 곱을 단일 지수로 표현하는 매개변수화의 한계일 뿐이다.

9. BCH 공식의 변형

9.1 Magnus 전개

Magnus 전개는 BCH 공식의 일반화이며, 시간 의존 미분 방정식의 해를 단일 지수로 표현한다.

$\frac{d}{dt}\mathbf{Y}(t) = \mathbf{A}(t)\mathbf{Y}(t)$

의 해는

$\mathbf{Y}(t) = \exp(\boldsymbol{\Omega}(t))\mathbf{Y}(0)$

이며, $\boldsymbol{\Omega}(t)$ 가 Magnus 전개로 표현된다.

9.2 Zassenhaus 공식

Zassenhaus 공식은 BCH의 역 형태이며, $e^{X+Y}$ 를 $e^X$ , $e^Y$ , 그리고 보정 항들의 곱으로 표현한다.

$e^{X+Y} = e^Xe^Ye^{-\frac{1}{2}[X, Y]}e^{\frac{1}{6}(2[Y, [X, Y]] + [X, [X, Y]])}\cdots$

이러한 변형들은 다양한 응용에서 활용된다.

10. 응용

10.1 자세 추정의 갱신

자세 추정에서 두 회전을 곱하는 연산이 빈번하다.

$\hat{\mathbf{R}}_{k+1} = \hat{\mathbf{R}}_k\exp([\boldsymbol{\delta\omega}]_\times)$

작은 보정 $\boldsymbol{\delta\omega}$ 에 대해 BCH 공식의 1차 근사가 사용된다. 그러나 큰 보정에서는 더 높은 차수의 항이 필요하다.

10.2 비선형 최적화

비선형 최적화에서 자세 변수의 매개변수화가 필요하다. 명목 자세 주위의 미소 변화로 매개변수화하면 BCH 공식의 1차 근사가 야코비안 계산에 활용된다.

10.3 매니퓰레이터 운동학

매니퓰레이터의 곱지수 공식에서 각 관절의 트위스트 지수가 곱해진다. 이들 사이의 관계를 분석할 때 BCH 공식이 사용된다.

10.4 운동 평균화

여러 회전의 평균을 계산할 때 BCH 공식이 활용된다. 작은 차이의 회전들에 대해 리 대수에서의 평균을 계산하는 것이 안정적이다.

10.5 시각적 SLAM

시각적 SLAM에서 카메라 자세의 갱신과 미분에 BCH 공식이 활용된다. 특히 자코비안 계산에서 핵심적이다.

11. BCH 공식의 야코비안 형태

11.1 좌측 야코비안

BCH 공식의 1차 미분은 좌측 야코비안 $\mathbf{J}_l$ 로 표현된다. 작은 보정 $\boldsymbol{\delta}$ 에 대해

$\log(\exp(X)\exp(\boldsymbol{\delta})) \approx X + \mathbf{J}_l^{-1}(X)\boldsymbol{\delta}$

이 식은 리 군의 곱이 리 대수에서 어떻게 표현되는지를 1차 근사로 보여준다.

11.2 우측 야코비안

마찬가지로 우측 야코비안 $\mathbf{J}_r$ 이 정의된다.

$\log(\exp(\boldsymbol{\delta})\exp(X)) \approx X + \mathbf{J}_r^{-1}(X)\boldsymbol{\delta}$

좌측과 우측 야코비안의 차이는 좌측 곱과 우측 곱의 차이에서 비롯된다.

11.3 응용

좌측과 우측 야코비안은 자세 추정, 비선형 최적화, 자동 미분 등 다양한 응용에서 핵심 도구이다.

12. 수치적 계산

12.1 직접 계산의 어려움

BCH 공식을 직접 계산하는 것은 리 괄호의 중첩으로 인해 빠르게 복잡해진다. 일반적으로 처음 몇 항만 사용한다.

12.2 계산 효율

$\mathfrak{so}(3)$ 이나 $\mathfrak{se}(3)$ 에서는 닫힌 형태의 곱셈(예: 회전 행렬 곱, 트위스트 지수 등)이 있으므로 BCH 공식을 직접 사용할 필요가 적다. 다만 분석적 이해와 야코비안 유도에는 BCH가 필수적이다.

12.3 일반 행렬 리 군

일반 행렬 리 군에서 BCH 공식의 처음 몇 항이 근사 계산에 사용된다.

13. 학습의 가치

BCH 공식을 이해하는 것은 다음과 같은 이점을 제공한다.

리 군의 비가환성을 정량적으로 다룰 수 있다.
자세 추정 알고리즘의 갱신 단계를 깊이 이해할 수 있다.
비선형 최적화의 야코비안 계산을 수행할 수 있다.
매니퓰레이터의 운동학과 동역학의 분석에 활용된다.
학술 문헌의 깊이 있는 표기와 유도를 이해할 수 있다.

14. 역사적 배경

BCH 공식은 19세기 말과 20세기 초에 헨리 베이커(Henry Baker), 존 캠벨(John Campbell), 펠릭스 하우스도르프(Felix Hausdorff) 등 여러 수학자들에 의해 발전되었다. 이름이 알파벳 순서가 아닌 것은 발견의 순서나 기여도를 반영한 것이다. 후에 유진 디닌(Eugene Dynkin)이 명시적 형태를 제시하였다.

15. 응용 예시: 작은 회전의 합성

두 작은 회전 벡터 $\boldsymbol{\omega}_1$ 과 $\boldsymbol{\omega}_2$ 의 합성을 계산해 보자. 1차 근사로

$\boldsymbol{\omega}_{\text{total}} \approx \boldsymbol{\omega}_1 + \boldsymbol{\omega}_2$

2차 보정을 추가하면

$\boldsymbol{\omega}_{\text{total}} \approx \boldsymbol{\omega}_1 + \boldsymbol{\omega}_2 + \frac{1}{2}\boldsymbol{\omega}_1 \times \boldsymbol{\omega}_2$

만약 $\boldsymbol{\omega}_1 = (0.1, 0, 0)$ 이고 $\boldsymbol{\omega}_2 = (0, 0.1, 0)$ 이면, 1차 근사는 $(0.1, 0.1, 0)$ 이고, 2차 근사는 $(0.1, 0.1, 0.005)$ 이다. 작은 z 성분이 비가환성으로 인한 보정이다.

16. 응용 예시: 자세 추정의 정확도

자세 추정 알고리즘에서 측정 갱신 단계는 다음과 같다.

$\hat{\mathbf{R}}_{\text{new}} = \hat{\mathbf{R}}_{\text{old}}\exp([\boldsymbol{\delta\omega}]_\times)$

여기서 $\boldsymbol{\delta\omega}$ 는 측정값으로부터 계산된 보정이다. 1차 근사로 단순히 회전 벡터의 가산이 사용되지만, 큰 보정에서는 BCH 공식의 더 높은 차수가 필요할 수 있다.

17. 참고 문헌

Hall, B. C. (2015). Lie Groups, Lie Algebras, and Representations: An Elementary Introduction (2nd ed.). Springer.
Stillwell, J. (2008). Naive Lie Theory. Springer.
Iserles, A., Munthe-Kaas, H. Z., Nørsett, S. P., & Zanna, A. (2000). “Lie-group methods.” Acta Numerica, 9, 215–365.
Murray, R. M., Li, Z., & Sastry, S. S. (1994). A Mathematical Introduction to Robotic Manipulation. CRC Press.
Sola, J., Deray, J., & Atchuthan, D. (2018). “A Micro Lie Theory for State Estimation in Robotics.” arXiv:1812.01537.
Magnus, W. (1954). “On the exponential solution of differential equations for a linear operator.” Communications on Pure and Applied Mathematics, 7(4), 649–673.

version: 1.0