1261.4 혼합형 아키텍처의 등장 배경

1. 심의형 제어의 구조적 한계

1960년대부터 1980년대 초반까지 로봇 행동 제어의 주류를 이루었던 심의형 제어(deliberative control)는 감지-모델링-계획-실행(Sense-Model-Plan-Act, SMPA)의 순차적 파이프라인에 기반한다. 이 접근법에서 로봇은 센서 데이터로부터 세계 모델(world model)을 구축하고, 해당 모델 위에서 탐색 알고리즘 또는 논리 추론을 수행하여 행동 계획을 수립한 뒤, 그 계획을 순차적으로 실행한다. SRI International의 Shakey 로봇(Nilsson, 1969)은 이러한 심의형 접근의 초기 구현체로서, STRIPS(Fikes & Nilsson, 1971) 계획 시스템을 통해 목표 상태에 도달하기 위한 연산자 시퀀스를 도출하였다.

그러나 심의형 제어는 다음과 같은 본질적 한계를 드러내었다.

첫째, 연산 지연(computational latency)의 문제이다. 복잡한 환경에 대한 세계 모델의 구축과 해당 모델 위에서의 계획 수립은 상당한 연산 시간을 요구한다. 1980년대의 연산 성능 수준에서, 현실적 규모의 상태 공간을 탐색하여 최적해를 구하는 데에는 수 초에서 수 분의 시간이 소요되었으며, 이는 동적 환경에서 실시간 대응을 사실상 불가능하게 하였다.

둘째, 세계 모델의 불완전성(incompleteness) 문제이다. 센서를 통해 구축된 내부 모델은 실세계의 불완전한 근사(approximation)에 불과하며, 환경의 비정형적 변화나 미지의 장애물에 의해 모델과 현실 간의 불일치가 빈번히 발생한다. 세계 모델이 현실과 괴리될 경우, 해당 모델에 기초한 계획은 무효화되며, 전체 계획의 재수립이 필요하게 된다.

셋째, 프레임 문제(frame problem, McCarthy & Hayes, 1969)로 불리는 이론적 난제이다. 어떤 행동이 세계의 어떤 측면을 변화시키며 어떤 측면을 변화시키지 않는지를 완전하게 명세하는 것은 연산적으로 비실용적이다. 이 문제는 심의형 접근이 확장성(scalability) 측면에서 본질적 제약을 갖고 있음을 시사한다.

2. 반응형 제어의 구조적 한계

Brooks(1986)는 심의형 접근의 한계를 정면으로 비판하며 포섭 아키텍처(subsumption architecture)를 제안하였다. 반응형 제어(reactive control)는 내부 세계 모델의 구축 없이 센서 입력으로부터 행동 출력으로의 직접 매핑(direct mapping)을 통해 작동한다. 이 접근법은 “세계 자체가 가장 좋은 모델이다(the world is its own best model)“라는 철학적 전제에 기초한다.

반응형 제어는 밀리초 단위의 응답 시간을 달성할 수 있으며, 환경 변화에 대한 즉각적 대응이 가능하다는 장점을 지닌다. 그러나 다음과 같은 구조적 한계가 확인되었다.

첫째, 장기 목표 추구(long-horizon goal pursuit)의 어려움이다. 반응형 행동은 현재 센서 입력에 대한 즉시적 반응만을 생성하므로, 다수의 하위 과제를 특정 순서대로 달성하여야 하는 복합 임무를 체계적으로 수행할 수 없다. 예를 들어, “건물 A에서 물체를 수거하여 건물 B로 운반하라“는 임무는 경로 계획, 물체 탐색, 파지(grasping), 운반, 배치라는 순차적 하위 과제로 분해되어야 하나, 순수 반응형 시스템에서는 이러한 순차적 분해와 실행 관리가 본질적으로 부재하다.

둘째, 국소 최솟값(local minima) 함정의 문제이다. 반응형 행동이 포텐셜 필드(potential field) 또는 벡터장 합산에 기반하는 경우, 상충하는 행동 벡터가 상쇄되어 로봇이 진행하지 못하는 교착 상태(deadlock)가 발생할 수 있다. Koren과 Borenstein(1991)은 인공 포텐셜 필드 방법의 국소 최솟값 문제를 체계적으로 분석하였으며, 이 문제는 전역적 정보를 활용한 계획 없이는 근본적으로 해결되지 않음을 보였다.

셋째, 학습 및 적응의 어려움이다. 반응형 행동은 설계 시점에 고정된 센서-행동 매핑에 의존하며, 경험에 기반한 행동 전략의 수정이나 새로운 환경에 대한 적응적 행동 생성이 구조적으로 제한된다.

3. 실세계 임무의 다중 시간 척도 요구

혼합형 아키텍처의 등장을 촉진한 근본 요인은 실세계 로봇 임무가 본질적으로 다중 시간 척도(multi-timescale)의 문제라는 점이다. 하나의 자율 로봇 시스템 내에서 다음과 같은 상이한 시간 척도의 처리가 동시에 요구된다.

시간 척도	처리 유형	적합 패러다임	대표 사례
밀리초 이하	센서-액추에이터 폐루프 제어	반응형	관절 토크 제어, 모터 전류 조절
밀리초~초	장애물 회피, 자세 보정	반응형	긴급 정지, 동적 장애물 대응
초~분	경로 추종, 행동 순서 관리	혼합형	경유점 기반 항법, 파지 시퀀스
분~시간	임무 계획, 자원 최적화	심의형	순찰 경로 스케줄링, 작업 배분

심의형 제어는 분~시간 척도의 계획 수립에 적합하지만 밀리초 단위의 반응성은 확보할 수 없다. 반응형 제어는 밀리초 단위의 즉각적 반응에 적합하지만 분 단위의 전략적 계획은 수행할 수 없다. 따라서 양 패러다임을 계층적으로 조직하여 각 시간 척도에 적합한 처리 방식을 배정하는 통합 아키텍처가 요구되었다.

4. 불확실성과 규칙성의 공존

실세계 작업 환경에서는 예측 가능한 정적 구조(static structure)와 예측 불가능한 동적 요소(dynamic element)가 공존한다. 건물의 벽면, 복도 구조, 문 위치 등은 상당 기간 불변하므로 사전 지도 기반의 심의적 경로 계획이 유효하다. 반면, 보행자, 이동 장비, 문의 개폐 상태 등은 사전 예측이 불가능하므로 실시간 센서 데이터에 기초한 반응적 대응이 불가결하다.

혼합형 아키텍처는 환경의 정적 구조에 대해서는 심의적 계획을 적용하여 전역적 최적성을 추구하고, 동적 요소에 대해서는 반응적 행동을 통해 실시간 안전성을 확보함으로써, 상호 보완적 처리를 실현한다.

5. 초기 혼합형 아키텍처의 제안

5.1 AuRA (Autonomous Robot Architecture)

Arkin(1987, 1989)이 제안한 AuRA는 혼합형 아키텍처의 초기 구현체 가운데 대표적 사례이다. AuRA는 계획기(planner), 스키마 관리자(schema manager), 운동 스키마(motor schema)의 세 구성 요소로 이루어진다. 계획기는 임무 계획기(mission planner)와 항법 계획기(navigator)로 구분되며, 상위 수준의 순차적 임무를 결정한다. 스키마 관리자는 계획기의 결정에 따라 적절한 운동 스키마를 활성화 또는 비활성화하며, 각 운동 스키마는 벡터장(vector field)으로 표현되는 반응적 행동 모듈이다. 복수의 스키마 출력은 벡터 합산을 통해 최종 행동 명령을 생성한다.

AuRA의 핵심 기여는 심의적 계획이 구체적 운동 명령이 아닌 반응적 행동 모듈의 구성(configuration)을 결정한다는 개념의 도입이다. 계획기는 어떤 반응적 행동을 어떤 파라미터로 활성화할 것인지를 결정하는 메타 수준(meta-level)의 역할만을 수행하며, 실제 운동 출력의 생성은 반응적 스키마에 위임된다.

5.2 RAP (Reactive Action Packages)

Firby(1989)가 제안한 RAP 시스템은 심의적 계획과 반응적 실행 사이에 실행 관리(executive management) 계층을 명시적으로 도입하였다. RAP에서 각 행동은 조건-행동 쌍(condition-action pair)의 패키지로 캡슐화된다. 동일한 목표에 대해 복수의 실현 방법(method)이 정의되며, 실행 시점에서 환경 조건을 평가하여 가장 적합한 방법을 선택한다. 선택된 방법이 실패하면 대안적 방법으로 자동 전환하는 견고한 실행 구조를 제공한다.

RAP의 기여는 계획과 실행 사이의 간극(plan-execution gap)을 명시적으로 인식하고, 실행 관리라는 별도의 기능 계층을 통해 이를 해결하고자 한 점이다. 이후 등장하는 3계층 아키텍처의 실행 계층(executive layer) 개념에 직접적 영향을 미쳤다.

5.3 ATLANTIS

Gat(1992)이 개발한 ATLANTIS 시스템은 혼합형 아키텍처의 3계층 구조를 명시적이고 형식적으로 제안한 중요한 사례이다. ATLANTIS는 다음의 세 계층으로 구성된다.

컨트롤러(Controller): 최하위 계층으로서, 센서와 액추에이터를 직접 연결하는 반응적 행동을 구현한다. 내부 상태를 유지하지 않거나 극히 제한적으로만 유지하며, 시간 제약이 가장 엄격하다.
시퀀서(Sequencer): 중간 계층으로서, 컨트롤러의 행동 모듈을 순차적 또는 조건적으로 활성화하고 전환하는 역할을 수행한다. 유한 상태 기계(FSM), 스크립트, 규칙 기반 시스템 등을 통해 구현된다.
심의기(Deliberator): 최상위 계층으로서, 시간적으로 확장된 추론과 계획 수립을 수행한다. 연산 집약적이며, 비동기적으로 작동하여 결과를 시퀀서에 전달한다.

ATLANTIS의 핵심 설계 원칙은 계층 간의 비동기적 작동이다. 하위 계층은 상위 계층의 응답을 차단 대기(blocking)하지 않으며 독립적으로 실행될 수 있어야 한다. 상위 계층은 하위 계층에 지시(directive)를 전달하되, 세부 실행 방법은 하위 계층에 위임한다. 심의기의 연산이 지연되더라도 컨트롤러의 반응적 행동은 중단되지 않아야 한다.

6. 계층 아키텍처의 일반화와 합의

6.1 표준 구조의 정립

1990년대 중반에 이르러, 다수의 독립적 연구에서 유사한 계층 구조가 반복적으로 도출됨에 따라, 혼합형 3계층 아키텍처는 로봇 아키텍처 연구 분야의 사실상의 합의 구조(consensus architecture)로 자리잡았다. Gat(1998)의 종합 논문 “On Three-Layer Architectures“는 이러한 합의를 체계적으로 정리하여, 심의 계층(deliberative layer), 실행 계층(executive layer, 또는 시퀀싱 계층), 반응 계층(reactive layer, 또는 행동 제어 계층)이라는 표준화된 용어 체계를 확립하였다.

3계층 구조의 일반화된 형태는 다음과 같다.

┌──────────────────────────┐
│   심의 계층                │ ← 임무 계획, 전역 최적화
│   (Deliberative Layer)    │   시간 척도: 초~분
├──────────────────────────┤
│   실행 계층                │ ← 행동 순서 관리, 상태 전이
│   (Executive Layer)       │   시간 척도: 밀리초~초
├──────────────────────────┤
│   반응 계층                │ ← 센서-액추에이터 폐루프
│   (Reactive Layer)        │   시간 척도: 밀리초 이하
└──────────────────────────┘

6.2 TCA (Task Control Architecture)

Simmons(1994)가 개발한 TCA는 혼합형 아키텍처를 위한 범용 실행 관리 프레임워크이다. TCA는 작업 트리(task tree)를 통한 계층적 작업 분해와 실행 관리를 제공하며, 핵심 메커니즘으로 시간적 제약(temporal constraints), 자원 제약(resource constraints), 예외 처리(exception handling)를 포함한다. 시간적 제약은 작업 간의 선행 관계와 동시성 조건을 명세하고, 자원 제약은 공유 자원에 대한 상호 배제를 관리하며, 예외 처리는 작업 실패 시의 복구 전략을 체계화한다. TCA는 이후 Carnegie Mellon University의 다수 로봇 프로젝트에서 실행 관리 계층의 기반 소프트웨어로 활용되었다.

6.3 CLARATy (Coupled Layer Architecture for Robotic Autonomy)

NASA Jet Propulsion Laboratory가 화성 탐사 로봇을 위해 개발한 CLARATy(Volpe et al., 2001)는 혼합형 아키텍처의 우주 탐사 분야 적용 사례이다. CLARATy는 기능 계층(functional layer)과 의사결정 계층(decision layer)의 2계층 구조를 기본으로 채택하되, 각 계층 내부에서 추상화 수준(level of abstraction)에 따른 연속적 세분화를 허용하는 유연한 구조를 제공한다. 기능 계층은 하드웨어 추상화, 센서 처리, 운동 제어를 포괄하며, 의사결정 계층은 계획 수립, 실행 관리, 진단을 담당한다.

7. 혼합형 아키텍처의 핵심 설계 원칙

다수의 혼합형 아키텍처 연구로부터 도출된 공통 설계 원칙을 정리하면 다음과 같다.

7.1 비동기적 계층 간 상호 작용

심의 계층의 계획 수립은 연산 집약적이므로, 그 결과를 대기하는 동안 반응 계층과 실행 계층이 차단되어서는 안 된다. 계층 간 통신은 비동기적으로 이루어져야 하며, 각 계층은 독립적 실행 주기(execution cycle)를 유지하여야 한다.

7.2 양방향 정보 흐름

명령은 상위 계층에서 하위 계층으로 전달되고, 상태 정보와 피드백은 하위 계층에서 상위 계층으로 전달되는 양방향 정보 흐름이 필수적이다. 하위 계층에서 행동 실패, 예외 상황, 환경 변화 등이 감지될 경우, 이 정보가 상위 계층에 적시에 전달되어 재계획(replanning)이 가능하여야 한다.

7.3 계층별 추상화 경계의 유지

각 계층은 명확한 추상화 경계를 유지하여야 한다. 상위 계층은 하위 계층의 구현 세부 사항에 의존하지 않으며, 하위 계층은 상위 계층의 전략적 판단과 독립적으로 작동할 수 있어야 한다. 이 원칙은 소프트웨어 공학의 계층화(layering) 원칙과 일치한다.

7.4 점진적 기능 저하

상위 계층의 장애 발생 시에도 하위 계층의 기본적 안전 행동은 유지되어야 한다. 이를 점진적 기능 저하(graceful degradation)라 한다. 심의 계층의 계획 수립이 실패하더라도 반응 계층의 장애물 회피, 비상 정지 기능은 정상적으로 작동하여야 한다.

8. 현대 로봇 시스템에서의 실현

현대의 ROS2 기반 로봇 시스템은 혼합형 3계층 구조를 암묵적으로 채택하고 있다. ROS2의 Nav2 항법 스택을 예로 들면, 전역 경로 계획기(global planner)가 심의 계층의 역할을, 행동 트리(Behavior Tree)가 실행 계층의 역할을, 지역 추종 제어기(local controller)와 장애물 회피 모듈이 반응 계층의 역할을 수행한다. 계층 간 통신은 ROS2의 토픽(topic), 서비스(service), 액션(action) 인터페이스를 통해 구현되며, 특히 액션 인터페이스는 장시간 행동의 비동기적 목표 전달, 중간 피드백, 결과 수신을 지원함으로써 혼합형 아키텍처의 계층 간 비동기 통신 원칙에 직접적으로 부합한다.

참고 문헌

Arkin, R. C. (1989). “Motor Schema–Based Mobile Robot Navigation.” International Journal of Robotics Research, 8(4), 92–112.
Brooks, R. A. (1986). “A Robust Layered Control System for a Mobile Robot.” IEEE Journal on Robotics and Automation, 2(1), 14–23.
Fikes, R. E., & Nilsson, N. J. (1971). “STRIPS: A New Approach to the Application of Theorem Proving to Problem Solving.” Artificial Intelligence, 2(3–4), 189–208.
Firby, R. J. (1989). Adaptive Execution in Complex Dynamic Worlds. PhD Thesis, Yale University.
Gat, E. (1992). “Integrating Planning and Reacting in a Heterogeneous Asynchronous Architecture for Controlling Real-World Mobile Robots.” Proceedings of the 10th National Conference on Artificial Intelligence (AAAI), 809–815.
Gat, E. (1998). “On Three-Layer Architectures.” In D. Kortenkamp, R. P. Bonasso, & R. Murphy (Eds.), Artificial Intelligence and Mobile Robots, MIT Press, 195–210.
Koren, Y., & Borenstein, J. (1991). “Potential Field Methods and Their Inherent Limitations for Mobile Robot Navigation.” Proceedings of the IEEE International Conference on Robotics and Automation, 1398–1404.
McCarthy, J., & Hayes, P. J. (1969). “Some Philosophical Problems from the Standpoint of Artificial Intelligence.” In B. Meltzer & D. Michie (Eds.), Machine Intelligence 4, Edinburgh University Press, 463–502.
Nilsson, N. J. (1969). “A Mobile Automaton: An Application of Artificial Intelligence Techniques.” Proceedings of the 1st International Joint Conference on Artificial Intelligence (IJCAI), 509–520.
Simmons, R. (1994). “Structured Control for Autonomous Robots.” IEEE Transactions on Robotics and Automation, 10(1), 34–43.
Volpe, R., et al. (2001). “The CLARATy Architecture for Robotic Autonomy.” Proceedings of the IEEE Aerospace Conference, 1, 121–132.