1261.5 로봇 행동 제어의 계층적 분류
1. 계층적 분류의 필요성
로봇 행동 제어 시스템은 단순한 반사적 반응에서부터 복잡한 다단계 임무 수행에 이르기까지 광범위한 스펙트럼을 포괄한다. 이러한 다양한 행동 제어 방식을 체계적으로 이해하고 비교하기 위해서는 분류 기준(taxonomy)의 수립이 필수적이다. 계층적 분류는 행동 제어 방식을 추상화 수준(level of abstraction), 의사결정 복잡도, 시간 범위, 인지적 요구도 등의 축을 기준으로 구조화함으로써, 특정 로봇 시스템에 적합한 행동 제어 전략의 선택과 설계를 지원한다.
Arkin(1998)은 로봇 행동 제어 방식의 분류 체계를 종합적으로 제시하였으며, Murphy(2000)는 이를 교육적 목적에서 재정리하였다. 본 절에서는 이러한 선행 분류 체계를 기반으로, 행동 제어의 계층적 구조를 추상화 수준에 따라 체계적으로 기술한다.
2. 반사적 행동 계층 (Reflexive Behavior Layer)
2.1 정의와 특성
반사적 행동(reflexive behavior)은 행동 제어의 최하위 계층에 위치하며, 센서 입력으로부터 액추에이터 출력으로의 직접적이고 고정된 매핑(fixed mapping)에 의해 구현된다. 이 계층의 행동은 내부 상태(internal state)를 유지하지 않으며, 지연 시간이 극히 짧아 밀리초 이하의 응답 시간을 달성한다.
반사적 행동은 생물학적 반사 신경계(reflex arc)와 유사한 구조를 갖는다. 자극(stimulus)과 반응(response) 사이에 중간 처리 과정이 존재하지 않거나 극히 단순하다. 로봇공학에서 반사적 행동의 전형적 사례는 다음과 같다.
- 접촉 감지 후 즉시 정지: 범퍼(bumper) 센서가 접촉을 감지하면 모터 전류를 즉시 차단한다.
- 과전류 보호: 모터 전류가 사전 설정 임계값을 초과하면 구동을 즉시 중단한다.
- 비상 정지(emergency stop): 비상 정지 신호 수신 시 모든 액추에이터를 즉시 비활성화한다.
2.2 구현 방식
반사적 행동은 하드웨어 인터럽트(hardware interrupt), 논리 회로, 또는 소프트웨어의 최우선 순위 인터럽트 서비스 루틴(ISR)으로 구현된다. 소프트웨어 기반 구현에서도 운영 체제의 스케줄링 지연을 최소화하기 위해 실시간 커널(real-time kernel)의 사용이 일반적이다.
3. 반응적 행동 계층 (Reactive Behavior Layer)
3.1 정의와 특성
반응적 행동(reactive behavior)은 반사적 행동보다 상위에 위치하며, 센서 데이터의 처리와 단순한 연산을 포함하되, 복잡한 내부 모델이나 기억(memory)에 의존하지 않는 행동을 생성한다. Brooks(1986)의 포섭 아키텍처(subsumption architecture)에서 각 층(layer)은 반응적 행동의 전형적 구현 단위이다.
반응적 행동의 특성은 다음과 같다.
- 무모델 처리(model-free processing): 센서 데이터로부터 직접적으로 행동 명령을 도출하며, 환경에 대한 내부 표상(internal representation)을 명시적으로 구축하지 않는다.
- 상황 의존적 활성화(situation-dependent activation): 특정 센서 조건이 충족될 때 행동이 활성화되며, 조건이 해제되면 비활성화된다.
- 병렬 실행 가능성: 다수의 반응적 행동이 동시에 활성화되어 병렬적으로 실행될 수 있으며, 행동 간의 조율(coordination)은 우선순위 기반 억제(priority-based inhibition) 또는 벡터 합산(vector summation) 등의 메커니즘을 통해 이루어진다.
3.2 대표적 행동 유형
반응적 행동 계층에서 빈번히 구현되는 행동 유형은 다음과 같다.
| 행동 유형 | 기능 | 센서 입력 | 출력 |
|---|---|---|---|
| 장애물 회피 | 근접 장애물로부터 반발력 생성 | 라이다, 초음파, 적외선 | 회피 방향 벡터 |
| 벽면 추종 | 벽면과 일정 거리 유지 | 거리 센서 | 방향 보정 벡터 |
| 목표 유인 | 목표 좌표 방향으로 인력 생성 | 위치 추정 결과 | 유인 방향 벡터 |
| 광원 추적 | 광원 방향으로 이동 | 광센서 | 이동 방향 벡터 |
Arkin(1989)의 운동 스키마(motor schema) 접근에서는 각 반응적 행동이 벡터장(vector field)으로 표현되며, 다수의 스키마 출력이 가중 합산되어 최종 운동 명령을 생성한다. 각 스키마의 이득(gain)은 임무 맥락에 따라 상위 계층으로부터 조정될 수 있다.
4. 심의적 행동 계층 (Deliberative Behavior Layer)
4.1 정의와 특성
심의적 행동(deliberative behavior)은 행동 제어의 상위 계층에 위치하며, 내부 세계 모델의 구축, 상태 공간 탐색, 논리적 추론 등의 연산 집약적 과정을 통해 행동 계획(action plan)을 수립한다. 이 계층의 행동은 현재 센서 입력만이 아니라, 기억된 과거 정보와 예측된 미래 상태에 기초하여 결정된다.
심의적 행동의 주요 특성은 다음과 같다.
- 모델 기반 추론(model-based reasoning): 환경에 대한 내부 모델(지도, 물체 목록, 상태 변수 등)을 유지하며, 이 모델 위에서 계획 수립, 최적화, 예측을 수행한다.
- 목표 지향성(goal-directedness): 명시적으로 정의된 목표 상태(goal state)를 향해 일련의 행동 순서를 탐색한다.
- 시간적 확장(temporal extension): 현재 시점 이후의 미래 상태 변화를 예측하고, 장기적 결과를 고려하여 행동을 결정한다.
- 연산 지연의 불가피성: 모델 구축과 탐색 과정에 상당한 연산 시간이 소요되므로, 실시간 제약이 엄격한 행동에는 부적합하다.
4.2 대표적 기능
심의적 행동 계층에서 수행되는 대표적 기능은 다음과 같다.
- 전역 경로 계획(global path planning): 지도 정보에 기초하여 출발점에서 목표점까지의 최적 경로를 탐색한다. A*, D*, RRT(Rapidly-exploring Random Tree) 등의 알고리즘이 적용된다.
- 작업 분해(task decomposition): 상위 수준의 임무 목표를 하위 수준의 실행 가능한 행동 시퀀스로 분해한다. HTN(Hierarchical Task Network) 계획이나 STRIPS 형식의 계획이 활용된다.
- 자원 할당(resource allocation): 다수의 하위 작업에 대해 시간, 에너지, 통신 대역폭 등의 자원을 최적으로 배분한다.
5. 실행 관리 계층 (Executive Management Layer)
5.1 정의와 특성
실행 관리 계층(executive layer)은 심의적 계획과 반응적 실행 사이의 중간 계층으로서, 계획된 행동 순서의 실시간 관리와 상황 적응적 전환을 담당한다. Firby(1989)의 RAP 시스템과 Gat(1992)의 ATLANTIS에서 시퀀서(sequencer)로 명명된 이 계층은, 이후 3계층 혼합형 아키텍처의 표준 구성 요소로 확립되었다.
실행 관리 계층의 핵심 기능은 다음과 같다.
- 행동 순서 제어(behavior sequencing): 심의 계층이 수립한 계획에 따라 반응적 행동 모듈을 적절한 순서로 활성화하고 비활성화한다.
- 상태 모니터링(status monitoring): 현재 실행 중인 행동의 진행 상태, 성공 또는 실패 여부를 지속적으로 감시한다.
- 조건 분기(conditional branching): 환경 조건이나 행동 실행 결과에 따라 다음에 활성화할 행동을 동적으로 선택한다.
- 예외 처리(exception handling): 행동 실패, 예기치 않은 센서 입력, 자원 부족 등의 예외 상황을 감지하고 적절한 복구 행동을 개시한다.
5.2 구현 형식
실행 관리 계층의 구현에는 다음과 같은 형식적 프레임워크가 활용된다.
- 유한 상태 기계(Finite State Machine, FSM): 상태와 전이 조건의 명시적 정의를 통해 행동 순서를 관리한다. ROS 생태계에서 SMACH(Bohren & Cousins, 2010)가 FSM 기반 실행 관리의 대표적 구현체이다.
- 행동 트리(Behavior Tree, BT): 순차, 선택, 병렬 등의 복합 노드와 행동 노드의 트리 구조를 통해 행동 순서와 폴백(fallback) 논리를 표현한다. Colledanchise와 Ögren(2018)이 형식적 정의를 제시하였으며, BehaviorTree.CPP가 ROS2 환경에서의 대표적 구현체이다.
- 스크립트 기반 시퀀싱: 절차적 프로그래밍 언어의 제어 구조(조건문, 반복문)를 활용하여 행동 순서를 기술한다.
6. 계층 간 관계의 구조화
6.1 종적 상호 작용
로봇 행동 제어의 계층적 분류에서, 계층 간의 상호 작용은 종적(vertical) 방향으로 이루어진다. 상위 계층은 하위 계층에 행동 지시(directive)를 전달하고, 하위 계층은 상위 계층에 상태 보고(status report)와 이벤트 통지(event notification)를 전달한다. 이 양방향 종적 통신은 다음과 같이 형식화될 수 있다.
\text{directive}: L_{i+1} \rightarrow L_i, \quad \text{report}: L_i \rightarrow L_{i+1}
여기서 L_i는 i번째 계층을 나타내며, 하위 계층일수록 i 값이 작다.
6.2 횡적 비의존성
동일 계층 내의 행동 모듈은 원칙적으로 상호 독립적으로 설계된다. 특히 반응적 행동 계층에서, 각 행동 모듈(장애물 회피, 벽면 추종, 목표 유인 등)은 다른 행동 모듈의 내부 상태를 참조하지 않으며, 독립적으로 센서 입력을 처리하여 행동 출력을 생성한다. 행동 간의 조율은 행동 중재(behavior arbitration) 또는 행동 합산(behavior fusion) 메커니즘에 의해 이루어진다.
6.3 추상화 수준과 시간 척도의 대응
계층적 분류에서 추상화 수준과 시간 척도(time scale) 사이에는 일관된 대응 관계가 존재한다. 하위 계층은 낮은 추상화와 짧은 시간 척도에서 작동하며, 상위 계층은 높은 추상화와 긴 시간 척도에서 작동한다.
| 계층 | 추상화 수준 | 시간 척도 | 연산 복잡도 | 상태 유지 |
|---|---|---|---|---|
| 반사적 행동 | 최저 | 밀리초 이하 | O(1) | 무상태 |
| 반응적 행동 | 저 | 밀리초~초 | O(n) | 무상태 또는 최소 상태 |
| 실행 관리 | 중 | 초~분 | O(n \log n) | 유한 상태 |
| 심의적 행동 | 고 | 분~시간 | O(n^k) 이상 | 완전 상태 모델 |
이러한 대응 관계는 3계층 혼합형 아키텍처의 설계 근거를 제공하며, 각 계층에 적합한 연산 자원과 통신 인프라의 할당 기준이 된다.
7. 분류 체계의 확장: 인지적 행동
최근의 로봇공학 연구에서는 전통적 4계층 분류를 넘어, 인지적 행동(cognitive behavior) 계층의 추가가 논의되고 있다. 인지적 행동은 학습(learning), 추상적 개념 형성(concept formation), 자기 인식(self-awareness) 등의 고차적 인지 기능에 기반한 행동 생성을 포괄한다. 강화 학습(reinforcement learning)에 의한 행동 정책의 자율적 획득, 경험에 기초한 행동 전략의 적응적 수정, 다중 목표 간의 가치 기반 선택 등이 이 계층에 해당한다.
다만, 인지적 행동의 계층적 위치에 대해서는 연구자 간의 합의가 완전히 이루어지지 않았으며, 심의적 행동의 상위 확장으로 보는 관점과 모든 계층에 걸쳐 횡단적으로 작용하는 메타 계층으로 보는 관점이 공존한다.
참고 문헌
- Arkin, R. C. (1989). “Motor Schema–Based Mobile Robot Navigation.” International Journal of Robotics Research, 8(4), 92–112.
- Arkin, R. C. (1998). Behavior-Based Robotics. MIT Press.
- Bohren, J., & Cousins, S. (2010). “The SMACH High-Level Executive.” IEEE Robotics & Automation Magazine, 17(4), 18–20.
- Brooks, R. A. (1986). “A Robust Layered Control System for a Mobile Robot.” IEEE Journal on Robotics and Automation, 2(1), 14–23.
- Colledanchise, M., & Ögren, P. (2018). Behavior Trees in Robotics and AI: An Introduction. CRC Press.
- Firby, R. J. (1989). Adaptive Execution in Complex Dynamic Worlds. PhD Thesis, Yale University.
- Gat, E. (1992). “Integrating Planning and Reacting in a Heterogeneous Asynchronous Architecture for Controlling Real-World Mobile Robots.” Proceedings of the 10th National Conference on Artificial Intelligence (AAAI), 809–815.
- Gat, E. (1998). “On Three-Layer Architectures.” In D. Kortenkamp, R. P. Bonasso, & R. Murphy (Eds.), Artificial Intelligence and Mobile Robots, MIT Press, 195–210.
- Murphy, R. R. (2000). Introduction to AI Robotics. MIT Press.