1261.13 행동 제어와 임무 계획의 관계

1. 행동 제어와 임무 계획의 개념적 구분

행동 제어(behavior control)와 임무 계획(mission planning)은 로봇 자율 시스템의 두 가지 핵심 기능 영역이며, 이 양자의 관계를 명확히 이해하는 것은 효과적인 로봇 아키텍처 설계의 필수 전제 조건이다.

행동 제어는 로봇이 특정 행동을 실행하는 과정에서의 실시간 제어 흐름을 관리하는 영역이다. 행동의 개시, 실행 중 상태 감시, 조건에 따른 행동 전환, 그리고 종료 처리를 포함한다. 행동 제어는 “어떻게(how)” 행동을 수행할 것인가에 초점을 맞추며, 반응적(reactive) 또는 전술적(tactical) 수준의 의사결정을 담당한다.

임무 계획은 로봇이 주어진 목표를 달성하기 위해 수행해야 할 행동의 순서와 구성을 결정하는 영역이다. 현재 세계 상태(world state)로부터 목표 상태(goal state)에 이르는 행동 시퀀스를 탐색하고 생성하는 과정이다. 임무 계획은 “무엇을(what)” 수행할 것인가에 초점을 맞추며, 전략적(strategic) 수준의 의사결정을 담당한다. Ghallab 등(2004)은 Automated Planning: Theory and Practice에서 이를 “주어진 초기 상태에서 목표 조건을 만족하는 행동 시퀀스의 합성“으로 정의하였다.

2. 계층적 관계 구조

2.1 수직적 계층 관계

행동 제어와 임무 계획은 수직적 계층(vertical hierarchy)을 형성한다. Gat(1998)이 제안한 3계층 아키텍처(Three-Layer Architecture)에서 이 관계는 명확히 드러난다.

심의 계층(Deliberative Layer): 임무 계획이 위치하는 계층이다. 세계 모델(world model)에 기반하여 목표를 달성하기 위한 행동 계획(action plan)을 수립한다. 계획 수립에는 상당한 계산 시간이 소요될 수 있으며, 비실시간(non-real-time) 환경에서 동작한다.

시퀀싱 계층(Sequencing Layer): 행동 제어가 위치하는 계층이다. 심의 계층에서 수립된 계획을 구체적인 행동 시퀀스로 변환하고, 행동의 실행 순서를 관리하며, 실행 중 발생하는 이벤트에 대응하여 행동 전환을 수행한다.

반응 계층(Reactive Layer): 센서-액추에이터 간의 직접적인 피드백 제어가 이루어지는 계층이다. 개별 행동의 실시간 실행을 담당한다.

이 계층 구조에서 임무 계획은 행동 제어에 대하여 상위 수준의 지시를 제공하고, 행동 제어는 임무 계획에 대하여 실행 결과를 보고한다.

2.2 정보 교환의 방향성

임무 계획에서 행동 제어로의 하향 정보 흐름(top-down information flow)은 다음을 포함한다.

  • 실행할 행동의 식별자(action identifier)
  • 행동의 매개변수(parameters)
  • 행동 실행의 전제 조건(preconditions)
  • 행동 간의 순서 제약(ordering constraints)
  • 목표 상태의 명세(goal specification)

행동 제어에서 임무 계획으로의 상향 정보 흐름(bottom-up information flow)은 다음을 포함한다.

  • 행동의 실행 상태(execution status)
  • 행동의 성공 또는 실패 여부
  • 예상치 못한 환경 변화의 감지
  • 실행 중 관측된 새로운 정보
  • 재계획(replanning)을 촉발하는 예외 보고

3. 임무 계획의 형식적 표현

3.1 STRIPS와 PDDL 표현

고전적 임무 계획은 Fikes와 Nilsson(1971)이 제안한 STRIPS(Stanford Research Institute Problem Solver) 형식에 기반한다. 각 행동(action)은 다음의 삼원소로 정의된다.

a = (\text{Pre}(a), \text{Add}(a), \text{Del}(a))

여기서 \text{Pre}(a)는 행동 a의 실행을 위한 전제 조건, \text{Add}(a)는 행동 실행 후 추가되는 사실(facts), \text{Del}(a)는 행동 실행 후 삭제되는 사실이다.

현대의 임무 계획에서는 McDermott 등(1998)이 제안한 PDDL(Planning Domain Definition Language)이 표준 기술 언어로 사용된다. PDDL은 도메인(domain) 정의와 문제(problem) 정의를 분리하여, 동일한 행동 모형을 다양한 문제 인스턴스에 재사용할 수 있게 한다.

3.2 임무 계획에서의 행동 추상화

임무 계획에서의 행동은 행동 제어에서의 행동과 추상화 수준(abstraction level)이 상이하다. 임무 계획의 행동은 전제 조건과 효과(effects)의 관점에서 기술되는 추상적 연산자(abstract operator)인 반면, 행동 제어의 행동은 센서 입력, 액추에이터 출력, 실행 시간 등을 포함하는 구체적 실행 단위(concrete execution unit)이다.

이러한 추상화 간극(abstraction gap)을 해소하기 위하여 계층적 작업 네트워크(Hierarchical Task Network, HTN)가 활용된다. Erol 등(1994)이 정식화한 HTN 계획에서는 고수준의 복합 작업(compound task)이 하위 수준의 원시 작업(primitive task)으로 순차적으로 분해된다.

t_{\text{compound}} \xrightarrow{\text{decompose}} (t_1, t_2, \ldots, t_k)

이 분해 과정에서 각 원시 작업 t_i는 행동 제어 수준에서 직접 실행 가능한 단위에 대응한다.

4. 행동 제어와 임무 계획의 상호작용 패턴

4.1 계획-실행-감시 순환 (Plan-Execute-Monitor Cycle)

행동 제어와 임무 계획의 기본적인 상호작용은 계획-실행-감시 순환(PEM cycle)에 의해 기술된다.

  1. 계획(Plan): 임무 계획기(mission planner)가 현재 세계 상태와 목표에 기반하여 행동 계획을 수립한다.
  2. 전달(Dispatch): 수립된 계획의 행동이 행동 제어 시스템에 순차적으로 전달된다.
  3. 실행(Execute): 행동 제어 시스템이 전달받은 행동을 실시간으로 실행한다.
  4. 감시(Monitor): 행동의 실행 결과와 환경 변화를 감시하고, 계획의 전제 조건 위반 여부를 검출한다.
  5. 재계획(Replan): 전제 조건의 위반이 감지되면 임무 계획기가 새로운 계획을 수립한다.

4.2 온라인 계획과 오프라인 계획

임무 계획은 실행 시점에 따라 오프라인 계획(offline planning)과 온라인 계획(online planning)으로 구분된다.

오프라인 계획은 행동 실행 이전에 전체 계획을 완성하는 방식으로, 세계 모델이 충분히 정확하고 환경 변화가 적은 경우에 적합하다. 행동 제어는 수립된 계획을 순차적으로 실행하며, 계획의 구조에 대한 수정 없이 행동 전환을 관리한다.

온라인 계획은 행동 실행과 계획 수립이 인터리빙(interleaving) 방식으로 교차 수행되는 전략이다. 동적 환경에서의 로봇 임무에 적합하며, 행동 제어로부터의 피드백이 임무 계획의 입력으로 지속적으로 반영된다. Ingrand와 Ghallab(2017)은 이러한 방식을 심의와 반응의 통합(deliberation-reaction integration)이라 하였다.

5. ROS2 환경에서의 구현적 관계

ROS2 기반 로봇 시스템에서 행동 제어와 임무 계획의 관계는 통신 패러다임을 매개로 구현된다.

임무 계획기는 상위 수준의 노드(node)로 구현되며, 행동 제어 시스템에 대하여 액션(Action) 통신을 통해 목표를 전달한다. 액션 통신의 목표 전달(goal submission), 피드백 수신(feedback reception), 결과 수신(result reception) 메커니즘은 임무 계획기와 행동 제어기 간의 상호작용을 체계적으로 지원한다.

행동 제어 시스템은 유한 상태 머신(FSM) 또는 행동 트리(BT)에 의해 개별 행동의 전환과 조합을 관리하며, 각 행동은 내부적으로 토픽(Topic) 통신을 통한 연속 제어 또는 서비스(Service) 통신을 통한 단기 연산으로 구현된다.

이러한 계층적 통신 구조는 임무 계획의 추상성과 행동 제어의 구체성을 연결하는 인터페이스 역할을 수행하며, 모듈성과 재사용성을 보장하는 아키텍처적 기반을 형성한다.

6. 상호 의존성과 설계 원칙

행동 제어와 임무 계획의 효과적인 통합을 위해서는 다음의 설계 원칙이 준수되어야 한다.

첫째, 관심사의 분리(Separation of Concerns)이다. 임무 계획은 행동의 내부 구현에 의존하지 않아야 하며, 행동 제어는 전체 임무의 구조에 의존하지 않아야 한다. 양자 간의 인터페이스는 행동의 전제 조건, 효과, 그리고 실행 상태에 대한 명세로 한정되어야 한다.

둘째, 느슨한 결합(Loose Coupling)이다. 임무 계획기와 행동 제어기는 표준화된 인터페이스를 통해 통신하며, 한쪽의 내부 구현 변경이 다른 쪽에 영향을 미치지 않아야 한다.

셋째, 장애 전파의 차단(Failure Isolation)이다. 행동 실행의 실패가 임무 계획기에 구조화된 형태로 보고되어야 하며, 임무 계획기는 이에 기반하여 대체 계획의 수립 또는 임무의 중단을 결정할 수 있어야 한다.

행동 제어와 임무 계획의 관계에 대한 체계적 이해는 확장 가능하고 유연한 로봇 자율 시스템의 구축을 위한 필수적인 이론적 토대이다.