1261.14 행동 제어에서의 불확실성 처리

1. 불확실성의 본질과 원천

로봇 행동 제어에서 불확실성(uncertainty)은 회피할 수 없는 본질적 요소이다. 실제 환경에서 동작하는 로봇은 센서의 부정확성, 액추에이터의 비이상적 거동, 환경의 동적 변화, 그리고 시스템 모형의 불완전성에 기인하는 다양한 불확실성에 노출된다. Thrun 등(2005)은 Probabilistic Robotics에서 이러한 불확실성의 체계적 처리가 강건한(robust) 로봇 행동 제어의 핵심 과제임을 역설하였다.

불확실성의 원천은 크게 네 가지 범주로 분류된다.

센서 불확실성(Sensor Uncertainty): 센서 측정값에 내재하는 잡음(noise), 편향(bias), 그리고 관측 범위의 제한에 기인한다. 센서 측정 모형은 일반적으로 확률적 모형으로 표현된다.

$\mathbf{z}_t = h(\mathbf{x}_t) + \mathbf{v}_t, \quad \mathbf{v}_t \sim \mathcal{N}(\mathbf{0}, R)$

여기서 $\mathbf{z}_t$ 는 시각 $t$ 에서의 측정값, $h$ 는 관측 함수, $\mathbf{x}_t$ 는 참 상태, $\mathbf{v}_t$ 는 관측 잡음, $R$ 은 잡음의 공분산 행렬이다.

액추에이터 불확실성(Actuator Uncertainty): 액추에이터의 응답 지연, 비선형성, 마찰, 백래시(backlash) 등에 의해 명령 입력과 실제 출력 사이에 괴리가 발생한다. 동작 모형의 불확실성은 다음과 같이 표현할 수 있다.

$\mathbf{x}_{t+1} = f(\mathbf{x}_t, \mathbf{u}_t) + \mathbf{w}_t, \quad \mathbf{w}_t \sim \mathcal{N}(\mathbf{0}, Q)$

여기서 $f$ 는 상태 전이 함수, $\mathbf{u}_t$ 는 제어 입력, $\mathbf{w}_t$ 는 프로세스 잡음, $Q$ 는 잡음의 공분산 행렬이다.

환경 불확실성(Environmental Uncertainty): 환경 내 동적 장애물의 이동, 조명 변화, 지형의 변화 등 예측 불가능한 환경 요인에 의한 불확실성이다.

모형 불확실성(Model Uncertainty): 로봇의 운동학적(kinematic) 또는 동역학적(dynamic) 모형이 실제 시스템의 거동을 불완전하게 반영하는 데 기인하는 불확실성이다.

2. 확률론적 상태 표현

2.1 신념 상태 (Belief State)

불확실성 하에서의 행동 제어는 로봇의 상태를 단일 점(point)이 아닌 확률 분포(probability distribution)로 표현하는 것에서 시작한다. 이를 신념 상태(belief state)라 하며, $b_t(\mathbf{x}) = P(\mathbf{x}_t \mid \mathbf{z}_{1:t}, \mathbf{u}_{1:t-1})$ 으로 정의된다. 여기서 $\mathbf{z}_{1:t}$ 는 시각 1부터 $t$ 까지의 관측 이력, $\mathbf{u}_{1:t-1}$ 은 제어 입력 이력이다.

신념 상태의 갱신은 베이즈 필터(Bayes filter)에 의해 재귀적으로 수행된다.

예측 단계(Prediction Step):

$\bar{b}_t(\mathbf{x}) = \int P(\mathbf{x}_t \mid \mathbf{x}_{t-1}, \mathbf{u}_{t-1}) \, b_{t-1}(\mathbf{x}_{t-1}) \, d\mathbf{x}_{t-1}$

갱신 단계(Update Step):

$b_t(\mathbf{x}) = \eta \, P(\mathbf{z}_t \mid \mathbf{x}_t) \, \bar{b}_t(\mathbf{x})$

여기서 $\eta$ 는 정규화 상수이다.

2.2 가우시안 표현과 칼만 필터

신념 상태가 가우시안 분포(Gaussian distribution)로 근사될 수 있는 경우, 칼만 필터(Kalman Filter)가 효율적인 신념 갱신 방법을 제공한다. 신념 상태는 평균 벡터 $\hat{\mathbf{x}}_t$ 와 공분산 행렬 $P_t$ 의 쌍 $(\hat{\mathbf{x}}_t, P_t)$ 으로 표현되며, 불확실성의 크기는 공분산 행렬의 고유값(eigenvalue)에 의해 정량화된다.

비선형 시스템에서는 확장 칼만 필터(Extended Kalman Filter, EKF) 또는 무향 칼만 필터(Unscented Kalman Filter, UKF)가 적용된다.

2.3 비가우시안 표현과 파티클 필터

다봉 분포(multimodal distribution)를 포함하는 일반적인 신념 상태의 표현에는 파티클 필터(Particle Filter)가 활용된다. 파티클 필터는 유한 개의 가중 표본(weighted sample)으로 임의의 확률 분포를 근사하며, 비선형·비가우시안 시스템에서의 신념 갱신에 적합하다.

$b_t(\mathbf{x}) \approx \sum_{i=1}^{N} w_t^{(i)} \, \delta(\mathbf{x} - \mathbf{x}_t^{(i)})$

여기서 $\mathbf{x}_t^{(i)}$ 는 $i$ 번째 파티클, $w_t^{(i)}$ 는 해당 가중치, $\delta$ 는 디랙 델타 함수이다.

3. 불확실성 하에서의 행동 선택

3.1 기대값 기반 의사결정

불확실성 하에서의 행동 선택은 기대 유용도(expected utility)의 최대화 원리에 기반한다. 행동 $a$ 의 기대 유용도는 다음과 같이 산출된다.

$\mathbb{E}[U(a)] = \int U(\mathbf{x}, a) \, b(\mathbf{x}) \, d\mathbf{x}$

최적 행동 $a^*$ 는 기대 유용도를 최대화하는 행동이다.

$a^* = \arg\max_{a \in \mathcal{A}} \mathbb{E}[U(a)]$

이 원리는 의사결정 이론(decision theory)의 근간이며, 불확실성 하에서의 합리적 행동 선택을 보장한다.

3.2 강건한 행동 선택

기대값 기반 의사결정은 확률 분포가 정확히 알려져 있다는 전제에 의존한다. 이 전제가 충족되지 않는 경우, 최악의 경우(worst case)에 대한 성능을 보장하는 강건 의사결정(robust decision-making)이 필요하다. 미니맥스(minimax) 기준은 다음과 같이 정식화된다.

$a^* = \arg\max_{a \in \mathcal{A}} \min_{\mathbf{x} \in \mathcal{X}} U(\mathbf{x}, a)$

이 접근법은 보수적(conservative)인 행동 선택을 유도하며, 안전 임계적(safety-critical) 로봇 응용에서 활용된다.

4. 행동 제어 아키텍처에서의 불확실성 통합

4.1 반응적 계층에서의 처리

반응적 행동 수준에서의 불확실성 처리는 주로 센서 데이터의 필터링과 강건한 감각 운동 변환(sensorimotor transformation)에 의해 이루어진다. 퍼지 논리(fuzzy logic)에 기반한 행동 제어는 센서 입력의 불확실성을 소속 함수(membership function)를 통해 처리하며, 불확실한 입력에 대해서도 연속적이고 부드러운 행동 출력을 생성한다.

4.2 전술적 계층에서의 처리

유한 상태 머신(FSM)이나 행동 트리(BT) 수준에서의 불확실성 처리는 상태 전이의 조건에 불확실성을 반영하는 방식으로 구현된다. 확률적 행동 트리(probabilistic behavior tree)에서는 각 조건 노드(condition node)가 이진(binary) 판단 대신 확률적 판단을 수행하며, 행동의 성공 확률에 기반하여 전환 결정을 내린다.

4.3 전략적 계층에서의 처리

임무 계획 수준에서의 불확실성 처리는 조건부 계획(contingent planning) 또는 확률적 계획(probabilistic planning)을 통해 이루어진다. 조건부 계획은 행동 실행의 결과에 따라 분기하는 계획 구조를 생성하며, 다양한 불확실한 결과에 대한 대비 전략을 사전에 수립한다.

5. 불확실성 처리를 위한 통신 설계

불확실성 정보의 전달은 행동 제어 시스템의 통신 설계에 직접적인 영향을 미친다. 상태 추정 결과를 전달하는 ROS2 메시지에는 추정값뿐만 아니라 공분산 행렬과 같은 불확실성 정량화 정보가 포함되어야 한다. geometry_msgs/PoseWithCovariance, nav_msgs/Odometry 등의 표준 메시지 타입은 이러한 불확실성 정보의 전달을 위한 필드를 제공한다.

행동 제어에서의 불확실성 처리는 단일 기법의 적용이 아닌, 센서 수준의 필터링부터 전략적 수준의 확률적 계획에 이르는 전 계층에 걸친 체계적 접근을 요구한다. 불확실성의 적절한 표현, 전파, 그리고 의사결정에의 통합은 실세계 환경에서의 강건한 로봇 행동 제어를 위한 이론적 필수 요건이다.