Part 135. 자율 임무 계획: 태스크 플래닝 (Autonomous Mission Planning: Task Planning)

1. 개요

자율 임무 계획(autonomous mission planning)은 로봇이 주어진 목표를 달성하기 위해 필요한 행동의 순서를 자동으로 생성하는 인공지능 기반 의사 결정 기술이다. 태스크 플래닝(task planning)은 이 과정의 핵심 메커니즘으로, 현재 상태에서 목표 상태에 이르는 행동 시퀀스를 탐색하고 최적화하는 계획 문제(planning problem)를 해결한다.

행동 트리와 유한 상태 머신이 사전에 설계된 정적(static) 의사 결정 구조를 제공하는 반면, 태스크 플래닝은 목표와 환경 조건에 따라 행동 계획을 동적(dynamic)으로 생성한다. 이러한 동적 계획 능력은 사전에 모든 상황을 예측하기 어려운 복잡한 임무 환경에서 필수적이며, 로봇의 자율성(autonomy) 수준을 근본적으로 향상시킨다.

2. 태스크 플래닝의 이론적 기반

2.1 고전적 계획 문제

태스크 플래닝의 이론적 기반은 인공지능(AI) 분야의 고전적 계획(classical planning)에 있다. 고전적 계획 문제는 다음 네 요소의 튜플 $\langle S, A, \gamma, s_0, G \rangle$ 로 형식화된다.

요소	기호	설명
상태 공간	$S$	가능한 모든 세계 상태의 집합
행동 집합	$A$	로봇이 수행할 수 있는 행동의 집합
전이 함수	$\gamma : S \times A \rightarrow S$	행동에 의한 상태 변화
초기 상태	$s_0 \in S$	현재 세계의 상태
목표 조건	$G \subseteq S$	달성하여야 할 상태 조건

계획 문제의 해(solution)는 초기 상태 $s_0$ 에서 시작하여 목표 조건 $G$ 를 충족하는 상태에 도달하는 행동 시퀀스 $\pi = \langle a_1, a_2, \ldots, a_n \rangle$ 이다.

2.2 PDDL (Planning Domain Definition Language)

PDDL은 계획 문제를 형식적으로 기술하기 위한 표준 언어로, 도메인(domain)과 문제(problem)의 분리를 통해 계획기의 범용성을 보장한다.

도메인 정의: 행동의 전제 조건(precondition)과 효과(effect)를 기술한다.
문제 정의: 초기 상태와 목표 조건을 기술한다.

(define (domain robot-delivery)
  (:predicates (at ?robot ?location)
               (holding ?robot ?object)
               (on ?object ?location))
  (:action pick-up
    :parameters (?robot ?object ?location)
    :precondition (and (at ?robot ?location)
                       (on ?object ?location))
    :effect (and (holding ?robot ?object)
                 (not (on ?object ?location)))))

3. 로봇 공학에서의 태스크 플래닝

3.1 행동 트리와의 관계

행동 트리는 태스크 플래너가 생성한 계획을 실행하는 실행 엔진(execution engine)으로 기능할 수 있다. 태스크 플래너가 목표 달성을 위한 행동 시퀀스를 생성하면, 행동 트리가 이를 실시간으로 실행하고 예외 상황에 대응한다.

역할	태스크 플래닝	행동 트리
계획 생성	동적 생성	정적 설계
실행 관리	제한적	강력
예외 처리	재계획	반응적 대응
복잡도	높은 계산 비용	낮은 계산 비용

3.2 계층적 태스크 네트워크 (HTN)

계층적 태스크 네트워크(Hierarchical Task Network, HTN) 플래닝은 태스크를 하위 태스크로 분해(decomposition)하는 계층적 접근 방식이다. 고수준의 추상적 태스크(예: “물체를 배달하라”)를 저수준의 구체적 행동(예: “경로를 계획하라”, “이동하라”, “물체를 집어라”)으로 분해한다.

HTN은 로봇 공학에서 특히 효과적인데, 이는 로봇의 행동이 본질적으로 계층적 구조를 가지기 때문이다.

4. ROS2 환경에서의 태스크 플래닝

4.1 PlanSys2

PlanSys2(Planning System 2)는 ROS2 환경에서 PDDL 기반 태스크 플래닝을 구현하는 프레임워크이다. PDDL 계획기(POPF, TFD 등)를 ROS2 노드로 래핑하여, 행동 트리 및 Nav2와의 통합을 지원한다.

PlanSys2의 주요 구성 요소는 다음과 같다.

구성 요소	역할
Domain Expert	PDDL 도메인 관리
Problem Expert	현재 상태 및 목표 관리
Planner	계획 생성
Executor	계획 실행 (행동 트리 기반)

4.2 계획과 실행의 통합

태스크 플래너가 생성한 계획을 행동 트리로 변환하여 실행하는 통합 아키텍처가 일반적이다.

[목표 설정] → [PDDL 문제 생성] → [계획기 호출] → [행동 시퀀스 생성]
     → [행동 트리 구성] → [실행] → [모니터링 및 재계획]

5. 태스크 플래닝의 응용

5.1 물류 로봇

창고에서 물품을 수집하고 배달하는 임무를 자동으로 계획한다. 수십 개의 물품, 복수의 로봇, 동적 장애물을 포함하는 복잡한 환경에서 최적의 행동 순서를 탐색한다.

5.2 서비스 로봇

가정이나 사무실에서 다양한 서비스 요청(음식 배달, 청소, 물건 정리)을 처리하기 위한 행동 계획을 생성한다.

5.3 다중 로봇 시스템

복수의 로봇이 협력하여 임무를 수행하는 경우, 태스크 할당(task allocation)과 태스크 플래닝을 결합하여 전체 시스템의 효율성을 최적화한다.

5.4 우주 탐사 로봇

사전에 예측할 수 없는 환경에서 자율적으로 탐사 경로와 샘플 수집 계획을 생성한다. 통신 지연으로 인해 원격 조종이 어렵기 때문에 온보드 태스크 플래닝이 필수적이다.

6. 현재의 도전과 연구 방향

6.1 계산 복잡도

고전적 계획 문제는 일반적으로 PSPACE-complete 이상의 계산 복잡도를 가진다. 대규모 상태 공간에서의 효율적 계획 생성은 여전히 활발한 연구 주제이다.

6.2 불확실성 하의 계획

실제 로봇 환경에서는 센서 잡음, 행동 실패, 환경 변화 등의 불확실성이 존재한다. 확률적 계획(probabilistic planning), 조건부 계획(contingent planning), 재계획(replanning) 등의 접근이 이 문제를 다룬다.

6.3 시간 제약

실시간 로봇 시스템에서는 계획 생성에 허용되는 시간이 제한된다. 임의 시간 알고리즘(anytime algorithm), 증분적 계획(incremental planning) 등이 이 요구를 충족하기 위해 연구되고 있다.

6.4 학습 기반 계획

강화 학습(reinforcement learning)과 모방 학습(imitation learning)을 태스크 플래닝에 통합하여, 경험으로부터 계획 성능을 향상시키는 연구가 활발히 진행되고 있다.

7. 참고 문헌

Ghallab, M., Nau, D., & Traverso, P. (2016). Automated Planning and Acting. Cambridge University Press.
Nau, D., et al. (2003). “SHOP2: An HTN Planning System.” Journal of Artificial Intelligence Research, 20, 379-404.
Colledanchise, M., & Ogren, P. (2018). Behavior Trees in Robotics and AI: An Introduction. CRC Press.
PlanSys2 공식 문서. https://plansys2.github.io/

버전	날짜	변경 사항
v0.1	2026-04-05	초안 작성