1261.6 센서-액추에이터 루프와 행동 제어의 관계

1. 센서-액추에이터 루프의 기본 구조

1.1 폐루프 제어의 원리

센서-액추에이터 루프(sensor-actuator loop)는 로봇이 환경과 상호 작용하는 가장 기초적인 메커니즘이다. 이 루프는 센서(sensor)를 통한 환경 상태의 감지, 제어 논리(control logic)에 의한 행동 결정, 액추에이터(actuator)를 통한 물리적 행동의 실행, 그리고 행동 결과가 환경에 반영된 후 다시 센서를 통해 관측되는 순환 과정으로 구성된다. 이를 형식적으로 표현하면 다음과 같다.

$\mathbf{s}(t) \xrightarrow{\text{sensing}} \mathbf{o}(t) \xrightarrow{\text{decision}} \mathbf{a}(t) \xrightarrow{\text{actuation}} \mathbf{s}(t+\Delta t)$

여기서 $\mathbf{s}(t)$ 는 시각 $t$ 에서의 환경 상태, $\mathbf{o}(t)$ 는 센서 관측 벡터, $\mathbf{a}(t)$ 는 액추에이터 명령 벡터, $\Delta t$ 는 루프 주기이다. 이 순환 구조가 폐루프(closed-loop) 제어의 근간을 이루며, 행동 제어는 이 루프 내의 의사결정 단계에 위치한다.

1.2 루프의 구성 요소

센서-액추에이터 루프의 각 구성 요소를 구체적으로 기술하면 다음과 같다.

센서 모듈(sensor module): 환경의 물리적 상태를 전기 신호로 변환한다. 로봇에 사용되는 주요 센서 유형에는 라이다(LiDAR), 카메라, 관성 측정 장치(IMU), 인코더(encoder), 힘/토크 센서(force/torque sensor), 초음파 센서 등이 있다. 각 센서의 출력은 고유한 측정 모델(measurement model)을 따르며, 잡음(noise), 편향(bias), 양자화 오차(quantization error) 등의 불확실성을 내포한다.

의사결정 모듈(decision module): 센서 관측으로부터 액추에이터 명령을 도출하는 핵심 처리 단계이다. 이 단계의 구현 방식이 행동 제어의 본질을 규정한다. 반응적 제어에서는 센서 입력에서 행동 출력으로의 직접 매핑 함수 $\pi: \mathbf{o} \rightarrow \mathbf{a}$ 가 사용되며, 심의적 제어에서는 내부 모델과 목표 상태에 기초한 계획 수립 과정이 개입한다.

액추에이터 모듈(actuator module): 의사결정 모듈의 출력을 물리적 운동으로 변환한다. 직류 모터(DC motor), 서보 모터(servo motor), 유압 실린더(hydraulic cylinder), 공압 액추에이터(pneumatic actuator) 등이 해당하며, 각 액추에이터는 고유한 동역학적 특성(관성, 마찰, 포화)을 갖는다.

2. 행동 제어에서 센서-액추에이터 루프의 역할

2.1 행동의 물리적 기반

행동 제어의 관점에서, 센서-액추에이터 루프는 로봇 행동(behavior)이 물리적으로 실현되는 기반 구조이다. Arkin(1998)은 행동(behavior)을 “관측 가능한 센서-액추에이터 간의 전달 함수(transfer function)“로 정의하였다. 즉, 하나의 행동은 특정 센서 입력 조건에서 특정 액추에이터 출력 패턴을 생성하는 기능적 단위이다.

이 정의에 따르면, 행동의 생성은 반드시 센서-액추에이터 루프를 통해 이루어지며, 루프가 작동하지 않는 한 행동은 관측 가능한 형태로 발현될 수 없다. 행동 제어 시스템의 설계는 곧 센서-액추에이터 루프 내의 의사결정 메커니즘을 설계하는 것과 동치이다.

2.2 루프 주기와 행동의 시간적 특성

센서-액추에이터 루프의 주기(loop period) $\Delta t$ 는 행동의 시간적 해상도(temporal resolution)를 결정한다. 루프 주기가 짧을수록 환경 변화에 대한 행동의 반응성이 높아지며, 보다 세밀한 운동 제어가 가능해진다.

로봇 시스템에서 루프 주기는 행동의 유형에 따라 상이하다.

행동 유형	전형적 루프 주기	센서 예시	액추에이터 예시
관절 토크 제어	0.1–1 ms	전류 센서, 인코더	모터 드라이버
자세 안정화	1–10 ms	IMU	관절 모터
장애물 회피	10–100 ms	라이다, 초음파	이동 플랫폼 모터
경로 추종	50–200 ms	라이다, 오도메트리	이동 플랫폼 모터
물체 파지	100–500 ms	힘/토크 센서, 카메라	그리퍼 모터

혼합형 아키텍처에서는 상이한 루프 주기를 갖는 다수의 센서-액추에이터 루프가 계층적으로 조직된다. 하위 계층의 루프는 짧은 주기로 반응적 행동을 실행하고, 상위 계층의 루프는 긴 주기로 전략적 의사결정을 수행한다.

3. 센서-액추에이터 루프의 형식적 모델

3.1 단일 행동의 루프 모델

하나의 반응적 행동 $b$ 는 다음의 폐루프 구조로 형식화될 수 있다.

$\mathbf{a}_b(t) = f_b\bigl(\mathbf{o}(t)\bigr)$

여기서 $f_b$ 는 행동 $b$ 의 센서-행동 매핑 함수(sensor-action mapping function)이다. 이 함수는 무상태(stateless)일 수도 있고, 내부 상태 $\mathbf{x}_b$ 를 유지하는 상태 의존적(stateful) 함수일 수도 있다. 상태 의존적 경우의 형식화는 다음과 같다.

$\mathbf{x}_b(t+1) = g_b\bigl(\mathbf{x}_b(t), \mathbf{o}(t)\bigr)$
$\mathbf{a}_b(t) = h_b\bigl(\mathbf{x}_b(t), \mathbf{o}(t)\bigr)$

여기서 $g_b$ 는 상태 전이 함수(state transition function), $h_b$ 는 출력 함수(output function)이다.

3.2 다중 행동의 루프 통합

복수의 행동이 동시에 활성화되는 경우, 각 행동의 액추에이터 출력을 통합하여 최종 명령을 결정하는 행동 조정(behavior coordination) 메커니즘이 필요하다. 대표적 조정 방식은 다음의 두 가지이다.

경쟁적 조정(competitive coordination): 활성화된 행동 중 하나만을 선택하여 액추에이터를 배타적으로 점유하게 한다. 우선순위 기반 중재(priority-based arbitration)가 이에 해당하며, Brooks(1986)의 포섭 아키텍처에서 상위 층의 행동이 하위 층의 행동을 억제(suppress)하거나 대체(subsume)하는 메커니즘이 대표적 사례이다.

$\mathbf{a}(t) = \mathbf{a}_{b^*}(t), \quad b^* = \arg\max_{b \in B_{\text{active}}} \text{priority}(b)$

협력적 조정(cooperative coordination): 활성화된 모든 행동의 출력을 합산 또는 가중 평균하여 최종 명령을 생성한다. Arkin(1989)의 운동 스키마 접근에서, 각 스키마의 벡터 출력이 가중 합산되는 방식이 대표적이다.

$\mathbf{a}(t) = \sum_{b \in B_{\text{active}}} w_b \cdot \mathbf{a}_b(t)$

여기서 $w_b$ 는 행동 $b$ 의 가중치(weight)이며, 상위 계층에 의해 조정될 수 있다.

4. 센서-액추에이터 루프와 계층적 행동 제어

4.1 내부 루프와 외부 루프의 중첩

실제 로봇 시스템에서 센서-액추에이터 루프는 단일 구조가 아니라, 다수의 루프가 중첩된 다중 루프(nested loop) 구조를 형성한다. 이를 내부 루프(inner loop)와 외부 루프(outer loop)의 계층적 중첩이라 한다.

내부 루프는 짧은 주기로 저수준 제어를 수행한다. 예를 들어, 관절 위치 제어 루프는 인코더 피드백에 기초하여 모터 전류를 조절하며, 수백 Hz에서 수 kHz의 주기로 작동한다. 외부 루프는 내부 루프를 포함하는 보다 넓은 순환 구조로서, 상위 수준의 센서(라이다, 카메라 등)로부터 환경 정보를 획득하고, 내부 루프에 목표값(setpoint)을 제공한다.

이 중첩 구조를 형식적으로 표현하면 다음과 같다.

$\underbrace{\mathbf{o}_{\text{high}}(t) \rightarrow \text{행동 선택} \rightarrow \mathbf{r}(t)}_{\text{외부 루프}} \rightarrow \underbrace{\mathbf{r}(t) \rightarrow \text{저수준 제어} \rightarrow \mathbf{a}(t)}_{\text{내부 루프}}$

여기서 $\mathbf{r}(t)$ 는 외부 루프가 내부 루프에 전달하는 기준값(reference)이다. 외부 루프의 행동 제어는 내부 루프의 저수준 제어가 안정적으로 작동함을 전제로 하며, 이는 제어 공학의 캐스케이드 제어(cascade control) 원리와 일치한다.

4.2 행동 제어 계층과 루프 구조의 대응

행동 제어의 계층적 분류와 센서-액추에이터 루프의 중첩 구조 사이에는 직접적 대응 관계가 존재한다. 각 행동 제어 계층은 고유한 센서-액추에이터 루프를 운영하며, 하위 계층의 루프는 상위 계층 루프의 내부에 중첩된다.

반사적 행동 계층: 하드웨어 수준의 최소 루프를 운영한다. 인터럽트 기반으로 작동하며, 루프 지연이 극히 짧다.
반응적 행동 계층: 센서 처리와 행동 매핑을 포함하는 소프트웨어 루프를 운영한다. 수십 Hz에서 수백 Hz의 주기가 일반적이다.
실행 관리 계층: 행동 전환과 상태 감시를 위한 이벤트 구동(event-driven) 루프를 운영한다. 반응적 행동 루프의 외부에서 작동하며, 행동 성공/실패 이벤트에 의해 구동된다.
심의적 행동 계층: 계획 수립 요청과 결과 수신을 위한 비동기 루프를 운영한다. 루프 주기가 가장 길며, 연산 완료 시점에 따라 비주기적으로 작동할 수 있다.

5. 센서-액추에이터 루프의 설계 고려사항

5.1 루프 지연과 안정성

센서-액추에이터 루프의 총 지연 시간(total latency)은 센서 지연(sensing latency), 연산 지연(computation latency), 통신 지연(communication latency), 액추에이터 지연(actuation latency)의 합으로 구성된다.

$\tau_{\text{total}} = \tau_{\text{sense}} + \tau_{\text{compute}} + \tau_{\text{comm}} + \tau_{\text{act}}$

루프 지연이 특정 임계값을 초과하면 폐루프 시스템의 안정성이 저하되며, 진동(oscillation)이나 발산(divergence)이 발생할 수 있다. Nyquist 안정도 판별법과 위상 여유(phase margin) 분석이 루프 안정성 평가에 적용된다. 행동 제어의 관점에서, 각 행동 루프의 지연이 해당 행동의 시간 척도와 양립 가능하여야 시스템의 안정적 작동이 보장된다.

5.2 샘플링 주기와 나이퀴스트 조건

센서의 샘플링 주기는 나이퀴스트-섀넌(Nyquist-Shannon) 정리에 의거하여, 감지하고자 하는 환경 변화의 최고 주파수 성분의 2배 이상이어야 한다. 행동 제어에서 환경의 동적 변화 속도가 빠를수록 센서-액추에이터 루프의 주기를 짧게 설정하여야 하며, 이는 연산 자원의 할당과 직접적으로 관련된다.

5.3 분산 시스템에서의 루프 구성

ROS2 기반 시스템에서 센서-액추에이터 루프는 다수의 노드(node)에 걸쳐 분산될 수 있다. 센서 노드가 토픽을 통해 관측 데이터를 발행하고, 행동 제어 노드가 해당 데이터를 구독하여 의사결정을 수행한 후, 액추에이터 노드에 명령을 전달하는 구조가 일반적이다. 이러한 분산 루프 구성에서는 노드 간 통신 지연이 루프 총 지연에 기여하므로, DDS QoS 정책의 적절한 설정과 통신 대역폭의 확보가 행동 제어의 실시간 성능에 직접적 영향을 미친다.

참고 문헌

Arkin, R. C. (1989). “Motor Schema–Based Mobile Robot Navigation.” International Journal of Robotics Research, 8(4), 92–112.
Arkin, R. C. (1998). Behavior-Based Robotics. MIT Press.
Brooks, R. A. (1986). “A Robust Layered Control System for a Mobile Robot.” IEEE Journal on Robotics and Automation, 2(1), 14–23.
Gat, E. (1998). “On Three-Layer Architectures.” In D. Kortenkamp, R. P. Bonasso, & R. Murphy (Eds.), Artificial Intelligence and Mobile Robots, MIT Press, 195–210.
Siciliano, B., & Khatib, O. (Eds.). (2016). Springer Handbook of Robotics (2nd ed.). Springer.