1261.8 브룩스(Brooks)의 포섭 아키텍처 개요

1. 포섭 아키텍처의 역사적 맥락

1.1 전통적 인공지능에 대한 비판

Rodney A. Brooks는 1986년 논문 “A Robust Layered Control System for a Mobile Robot“에서 포섭 아키텍처(subsumption architecture)를 처음으로 제안하였다. 이 아키텍처는 1980년대 인공지능 연구에서 주류를 이루던 감지-모델링-계획-실행(Sense-Model-Plan-Act, SMPA) 패러다임에 대한 근본적 비판 위에 구축되었다.

Brooks(1991)는 “Intelligence Without Representation“에서 전통적 인공지능의 네 가지 근본적 문제점을 지적하였다. 첫째, 세계 모델의 구축과 유지에 과도한 연산 자원이 소모된다. 둘째, 센서 데이터로부터 심볼 표상(symbolic representation)으로의 변환 과정에서 정보 손실이 발생한다. 셋째, 계획 수립에 소요되는 시간이 동적 환경에서의 실시간 행동을 방해한다. 넷째, 심볼 접지 문제(symbol grounding problem)로 인해 내부 기호와 외부 세계 사이의 의미적 연결이 보장되지 않는다.

1.2 MIT 이동 로봇 연구

포섭 아키텍처는 MIT 인공지능 연구소(AI Lab)에서 일련의 이동 로봇 실험을 통해 발전하였다. Allen(1985년경 개발)은 포섭 아키텍처가 최초로 적용된 이동 로봇이며, 초음파 센서를 사용한 장애물 회피와 배회(wandering) 행동을 시연하였다. 이후 Herbert, Toto, Genghis 등의 로봇에서 포섭 아키텍처의 적용이 확장되었으며, 특히 6족 보행 로봇 Genghis(Brooks, 1989b)에서 12개의 독립적 행동 층이 조율되어 복잡한 보행 행동이 발현됨을 보였다.

2. 포섭 아키텍처의 구조

2.1 층 기반 구성

포섭 아키텍처의 핵심 구조적 특징은 로봇의 행동 시스템을 수평적 기능 모듈(감지, 계획, 실행)이 아닌, 수직적 행동 층(behavioral layer)으로 조직한다는 점이다. 각 층은 센서 입력으로부터 액추에이터 출력까지의 완전한 경로를 포함하는 독립적 행동 단위이다.

전통적 SMPA 접근에서는 시스템이 기능별로 수평 분할(horizontal decomposition)된다. 즉, 센서 처리 모듈, 모델 구축 모듈, 계획 모듈, 실행 모듈이 순차적으로 배열된다. 반면, 포섭 아키텍처에서는 시스템이 행동별로 수직 분할(vertical decomposition, 또는 task-level decomposition)된다. 각 층은 특정 행동 역량(behavioral competence)을 구현하며, 독자적인 센서 처리와 액추에이터 제어 경로를 보유한다.

이 구조를 도식화하면 다음과 같다.

전통적 수평 분할              포섭 아키텍처의 수직 분할

┌──────────────────┐    ┌──────────────────────────────┐
│     계획         │    │ 층 2: 탐색(explore)    S→A    │
├──────────────────┤    ├──────────────────────────────┤
│     모델링       │    │ 층 1: 배회(wander)     S→A    │
├──────────────────┤    ├──────────────────────────────┤
│     감지         │    │ 층 0: 회피(avoid)      S→A    │
└──────────────────┘    └──────────────────────────────┘

2.2 역량의 점진적 축적

포섭 아키텍처에서 각 층은 로봇의 행동 역량 수준(level of competence)을 나타낸다. 하위 층은 기본적 생존 행동(장애물 회피, 비상 정지 등)을 구현하고, 상위 층은 보다 고차적 행동(목표 지향 이동, 탐색 등)을 구현한다. Brooks(1986)는 Allen 로봇에 대해 다음과 같은 역량 수준을 정의하였다.

층	역량 수준	행동 설명
층 0	장애물 회피	근접 장애물로부터 회피 반응 생성
층 1	배회	무작위 방향으로의 목적 없는 이동
층 2	탐색	원거리 관심 지점을 향한 방향성 이동

핵심 설계 원리는 상위 층을 추가하여도 하위 층의 수정이 불필요하다는 점이다. 각 층은 독립적으로 개발, 시험, 배포될 수 있으며, 이를 점진적 개발(incremental development) 원리라 한다.

3. 계층 간 조정 메커니즘

3.1 억제와 금지

포섭 아키텍처에서 계층 간의 조정은 두 가지 기본 메커니즘으로 실현된다.

억제(suppression): 상위 층이 하위 층의 출력 신호를 자신의 출력 신호로 대체하는 메커니즘이다. 억제가 작동하면 하위 층의 내부 연산은 계속 수행되지만, 그 출력이 액추에이터에 도달하지 못하고 상위 층의 출력으로 대체된다.

금지(inhibition): 상위 층이 하위 층의 입력 신호를 차단하는 메커니즘이다. 금지가 작동하면 하위 층은 센서 입력을 수신하지 못하게 되며, 따라서 해당 행동이 비활성화된다.

이 두 메커니즘은 포섭(subsumption)의 근간을 이루며, “상위 층이 하위 층을 포섭한다“는 명칭의 유래이다. 형식적으로, 두 메커니즘은 다음과 같이 표현된다.

$\text{억제: } \mathbf{a}_{\text{out}} = \begin{cases} \mathbf{a}_{\text{high}} & \text{if 상위 층 활성} \\ \mathbf{a}_{\text{low}} & \text{otherwise} \end{cases}$

$\text{금지: } \mathbf{o}_{\text{low}} = \begin{cases} \mathbf{0} & \text{if 상위 층 활성} \\ \mathbf{o}_{\text{sensor}} & \text{otherwise} \end{cases}$

3.2 비동기적 병렬 실행

포섭 아키텍처의 또 다른 핵심 특성은 모든 층이 비동기적으로 병렬 실행된다는 점이다. 각 층은 독립적인 실행 주기를 가지며, 다른 층의 연산 완료를 기다리지 않는다. 층 간 통신은 유선(wire)이라 불리는 비동기 메시지 전달 채널을 통해 이루어지며, 최신 메시지가 이전 메시지를 덮어쓰는 최신값 유지(latest value) 방식이 사용된다.

4. 내부 구현: AFSM

4.1 증강 유한 상태 기계

포섭 아키텍처에서 각 행동 모듈은 증강 유한 상태 기계(Augmented Finite State Machine, AFSM)로 구현된다. AFSM은 전통적 FSM에 내부 타이머(timer)와 내부 레지스터(register)를 추가한 확장 모델이다.

각 AFSM은 다음의 구성 요소를 포함한다.

유한 상태 집합: 행동 모듈의 이산적 내부 상태를 정의한다.
입력 포트(input port): 센서 데이터 또는 다른 AFSM의 출력을 수신한다.
출력 포트(output port): 액추에이터 명령 또는 다른 AFSM으로의 신호를 전송한다.
전이 규칙(transition rule): 입력 조건과 현재 상태에 기초하여 다음 상태와 출력을 결정한다.
타이머(timer): 시간 기반 상태 전이를 지원한다. 예를 들어, 특정 시간 동안 입력이 없으면 다른 상태로 전이한다.

AFSM 간의 연결은 유선(wire)을 통해 이루어지며, 억제선(suppression wire)과 금지선(inhibition wire)이 층 간 조정을 위한 특수 연결로 사용된다.

4.2 구현 사례: 장애물 회피

층 0의 장애물 회피 행동을 AFSM으로 구현한 사례를 기술하면 다음과 같다. 초음파 센서로부터 거리 데이터를 입력 포트로 수신한다. 측정 거리가 임계값 미만이면 ‘halt’ 상태로 전이하여 모터를 정지시키고, 임계값 이상이면 ‘run’ 상태를 유지하여 현재 운동을 지속한다. ‘halt’ 상태에서 일정 시간이 경과하면 ‘turn’ 상태로 전이하여 회전 명령을 생성하고, 회전 후 센서 입력을 재평가하여 ‘run’ 상태로 복귀한다.

5. 포섭 아키텍처의 설계 원칙

Brooks(1986, 1991)가 제시한 포섭 아키텍처의 핵심 설계 원칙은 다음과 같이 정리된다.

5.1 표상 없는 지능 (Intelligence Without Representation)

중앙 집중적 세계 모델의 구축과 유지를 배제한다. 로봇은 센서를 통해 환경을 직접 참조하며, 내부 기호적 표상에 의존하지 않는다.

5.2 점진적 구성 (Incremental Construction)

시스템은 하위 층부터 점진적으로 구축된다. 각 층은 독립적으로 시험되고 검증된 후에야 상위 층이 추가된다. 이 원리는 시스템의 견고성(robustness)과 디버깅 용이성을 보장한다.

5.3 상향식 설계 (Bottom-Up Design)

가장 기초적인 생존 행동(회피, 정지)으로부터 시작하여 점차 고차적 행동(탐색, 목표 추구)을 추가한다. 이 순서는 동물의 진화적 발달 과정과 유비적(analogical)이다. Brooks(1989a)는 이를 “생물의 진화사를 빠르게 재현하라(recapitulate evolution)“는 원칙으로 표현하였다.

5.4 병렬성과 비동기성

모든 행동 모듈은 독립적으로 병렬 실행되며, 중앙 집중적 스케줄러나 동기화 메커니즘이 존재하지 않는다. 이 원칙은 단일 모듈의 장애가 전체 시스템을 마비시키지 않는 결함 허용성(fault tolerance)을 제공한다.

6. 포섭 아키텍처의 한계

6.1 확장성 문제

포섭 아키텍처의 가장 빈번히 지적되는 한계는 확장성(scalability)의 부족이다. 층의 수가 증가함에 따라 층 간의 억제/금지 관계가 복잡해지며, 전체 시스템의 행동을 예측하거나 디버깅하기가 급격히 어려워진다. Arkin(1998)은 실용적 한계를 약 10–15개 층 수준으로 추정하였다.

6.2 임의적 순차 행동의 표현 불가

포섭 아키텍처에서는 “A를 수행한 후 B를 수행하라“와 같은 명시적 순서 제약을 자연스럽게 표현하기 어렵다. 순차적 행동은 타이머나 내부 레지스터를 활용하여 간접적으로 구현할 수 있으나, 복잡한 순차 임무에 대해서는 구조적으로 적합하지 않다.

6.3 학습 메커니즘의 부재

원래의 포섭 아키텍처는 고정된 행동 모듈과 고정된 층 간 연결로 구성되므로, 경험에 기반한 행동의 적응적 수정이나 새로운 행동의 자율적 생성을 지원하지 않는다. Maes(1990)는 이 한계를 해결하기 위해 학습 기반의 행동 선택 네트워크를 제안하였다.

7. 포섭 아키텍처의 학술적 영향

포섭 아키텍처는 로봇공학 연구의 패러다임 전환에 핵심적 기여를 하였다. 이 아키텍처가 촉발한 반응형 제어에 대한 관심은 궁극적으로 심의-반응 통합을 추구하는 혼합형 아키텍처의 발전으로 이어졌다. 현대 로봇 시스템에서 반응 계층의 행동 모듈 설계, 우선순위 기반 행동 중재, 점진적 시스템 구축 등의 원리는 포섭 아키텍처의 직접적 유산이다.

참고 문헌

Brooks, R. A. (1986). “A Robust Layered Control System for a Mobile Robot.” IEEE Journal on Robotics and Automation, 2(1), 14–23.
Brooks, R. A. (1989a). “A Robot That Walks: Emergent Behaviors from a Carefully Evolved Network.” Neural Computation, 1(2), 253–262.
Brooks, R. A. (1989b). “The Whole Iguana.” In M. Brady (Ed.), Robotics Science, MIT Press, 432–456.
Brooks, R. A. (1991). “Intelligence Without Representation.” Artificial Intelligence, 47(1–3), 139–159.
Arkin, R. C. (1998). Behavior-Based Robotics. MIT Press.
Maes, P. (1990). “Situated Agents Can Have Goals.” Robotics and Autonomous Systems, 6(1–2), 49–70.