1313.50 PDDL 도메인 설계의 향후 표준화 동향

1313.50 PDDL 도메인 설계의 향후 표준화 동향

1. PDDL 표준화의 역사적 맥락

PDDL(Planning Domain Definition Language)은 1998년 제1회 국제 플래닝 경진대회(International Planning Competition, IPC)를 위해 Drew McDermott 등에 의해 최초로 제안된 이래, 자동화된 플래닝 연구의 공통 언어로 기능해 왔다. 초기 PDDL 1.2에서 시작하여 PDDL 2.1(시간적 플래닝), PDDL 3.0(선호도 및 제약), PDDL 3.1(객체 플루언트)에 이르기까지, 각 버전의 발전은 IPC의 요구사항과 학술 커뮤니티의 합의를 통해 이루어졌다. 그러나 PDDL 3.1 이후 공식적인 새 버전의 발표는 이루어지지 않았으며, 표준화 과정이 사실상 정체된 상태에 있다.

이러한 정체의 원인으로는 플래닝 연구 커뮤니티 내부의 다양한 요구사항 충돌, 실제 로봇 응용과 이론적 벤치마크 사이의 간극, 그리고 비공식 확장의 난립 등이 지적된다. 현재 PDDL의 향후 표준화는 여러 방향에서 논의되고 있으며, 이하에서 그 주요 동향을 체계적으로 분석한다.

2. 현행 PDDL 표준의 한계

현행 PDDL 표준이 실제 로봇 시스템에 적용될 때 드러나는 주요 한계는 다음과 같다.

2.1 확률적 불확실성 표현의 부재

고전적 PDDL은 결정론적 세계 모델을 전제한다. 액션의 효과는 전제 조건이 충족되면 항상 동일하게 발생하며, 센서 관측의 불확실성이나 확률적 전이를 명시적으로 표현할 수 없다. PPDDL(Probabilistic PDDL)이 IPC 2004와 2006에서 사용되었으나, 이는 공식 표준으로 채택되지 않았으며 플래너 지원도 제한적이다.

2.2 연속 변수와 하이브리드 시스템 표현의 제한

PDDL 2.1은 수치 플루언트(numeric fluent)와 지속 액션(durative-action)을 도입하여 연속적인 시간과 자원을 부분적으로 모델링할 수 있게 하였다. 그러나 연속 동역학(continuous dynamics), 미분 방정식 기반의 상태 변화, 하이브리드 오토마타(hybrid automata) 수준의 표현력은 지원하지 않는다. PDDL+는 이러한 하이브리드 플래닝을 위해 프로세스(process)와 이벤트(event) 구문을 도입하였으나, 공식 PDDL 버전으로 통합되지 않은 상태이다(Fox & Long, 2006).

2.3 다중 에이전트 플래닝 지원의 미비

단일 에이전트 중심의 PDDL 구조는 다중 로봇 시스템에서 각 에이전트의 개별 능력, 동시 액션, 에이전트 간 통신 및 협력을 자연스럽게 표현하기 어렵다. MA-PDDL(Multi-Agent PDDL) 등의 확장이 연구되었으나(Kovacs, 2012), 표준화에는 이르지 못하였다.

2.4 계층적 태스크 분해의 통합 부재

HTN(Hierarchical Task Network) 플래닝은 복합 태스크를 하위 태스크로 분해하는 계층적 접근을 사용하며, 실제 로봇 임무 계획에서 널리 활용된다. 그러나 고전적 PDDL은 HTN의 메서드(method)와 태스크 분해 구조를 표현하는 구문을 포함하지 않는다.

3. 주요 표준화 논의 방향

3.1 HDDL: 계층적 플래닝 도메인 정의 언어

HDDL(Hierarchical Domain Definition Language)은 PDDL에 HTN 플래닝 기능을 통합하기 위해 제안된 확장이다(Holler et al., 2020). HDDL은 PDDL 구문을 기반으로 하면서 다음과 같은 구성 요소를 추가한다:

  • 태스크 선언(:task): 추상 태스크와 원시 태스크(primitive task)를 구분하여 정의한다.
  • 메서드 선언(:method): 추상 태스크를 하위 태스크 시퀀스로 분해하는 규칙을 명시한다.
  • 순서 제약(:ordering): 하위 태스크 간의 실행 순서를 부분 순서(partial order) 또는 전체 순서(total order)로 지정한다.
;; HDDL 메서드 정의 예시
(:method deliver_package
    :parameters (?r - robot ?p - package ?from - location ?to - location)
    :task (deliver ?r ?p ?to)
    :precondition (and
        (robot_at ?r ?from)
        (package_at ?p ?from)
    )
    :ordered-subtasks (and
        (pick_up ?r ?p ?from)
        (move ?r ?from ?to)
        (put_down ?r ?p ?to)
    )
)

HDDL은 2020년 IPC의 HTN 트랙에서 공식 입력 언어로 채택되었으며, 이는 계층적 플래닝의 표준화를 향한 중요한 진전으로 평가된다.

3.2 PDDL+ 및 하이브리드 플래닝의 표준화

PDDL+는 Fox와 Long(2006)이 제안한 확장으로, 연속적인 물리 프로세스와 외인성 이벤트(exogenous event)를 PDDL 프레임워크 내에서 모델링할 수 있게 한다. PDDL+의 핵심 구문은 다음과 같다:

  • 프로세스(:process): 특정 조건이 유지되는 동안 연속적으로 수치 변수를 변화시키는 구성 요소이다.
  • 이벤트(:event): 특정 조건이 충족될 때 자동으로 발생하는 이산적 상태 전이이다.
;; PDDL+ 프로세스 정의 예시
(:process battery_drain
    :parameters (?r - robot)
    :precondition (moving ?r)
    :effect (decrease (battery_level ?r) (* #t 0.5))
)

(:event battery_depleted
    :parameters (?r - robot)
    :precondition (< (battery_level ?r) 0.1)
    :effect (and
        (not (moving ?r))
        (battery_empty ?r)
    )
)

로봇 공학에서 배터리 소모, 연료 감소, 물리적 마모 등의 연속 프로세스를 정확히 모델링해야 하는 요구가 증가함에 따라, PDDL+의 공식 표준 통합에 대한 논의가 지속되고 있다.

3.3 확률적 플래닝 언어의 통합

PPDDL(Probabilistic PDDL)은 Younes와 Littman(2004)이 제안한 확장으로, 액션의 확률적 효과를 모델링한다. RDDL(Relational Dynamic Influence Diagram Language)은 Sanner(2010)가 제안한 대안적 언어로, 마르코프 결정 과정(MDP)과 부분 관측 마르코프 결정 과정(POMDP)을 보다 자연스럽게 표현할 수 있다.

현재 확률적 플래닝 분야에서는 PDDL 기반의 확률적 확장과 RDDL 중 어떤 접근이 표준이 되어야 하는지에 대한 합의가 이루어지지 않았다. IPC에서는 두 언어가 별도의 트랙에서 사용되고 있다.

3.4 수치 플래닝의 확장

PDDL 2.1에서 도입된 수치 플루언트는 정수와 실수 값을 지원하지만, 비선형 수치 제약, 최적화 목적 함수의 다양화, 자원 할당 문제의 정밀한 모델링에는 한계가 있다. 향후 표준에서는 다음과 같은 수치 플래닝 기능의 확장이 논의되고 있다:

  • 비선형 수치 효과와 전제 조건의 지원
  • 다중 목적 최적화(multi-objective optimization) 구문
  • 자원 용량 제약(resource capacity constraint)의 명시적 표현

4. 온톨로지 기반 도메인 모델링과의 융합

PDDL 도메인 설계의 또 다른 표준화 방향은 온톨로지(ontology) 기반 지식 표현과의 융합이다. OWL(Web Ontology Language)이나 KnowRob 등의 로봇 지식 프레임워크에서 정의된 개념 체계를 PDDL 도메인의 타입 계층 및 술어 설계에 반영하려는 시도가 진행되고 있다.

이러한 융합의 목표는 다음과 같다:

  1. 도메인 재사용성 향상: 표준화된 온톨로지에 기반한 PDDL 도메인은 다양한 로봇 플랫폼과 임무 시나리오에서 재사용될 수 있다.
  2. 의미적 상호 운용성 확보: 서로 다른 시스템 간에 도메인 모델의 의미를 명확히 공유할 수 있다.
  3. 자동 도메인 생성: 온톨로지로부터 PDDL 도메인을 자동 생성하는 도구의 개발이 가능해진다.

IEEE의 로봇 온톨로지 표준화 작업(IEEE 1872-2015, Ontologies for Robotics and Automation)은 이러한 융합의 기반을 제공하며, PDDL 도메인 설계에 대한 상위 수준의 의미적 프레임워크를 제시한다.

5. 기계 학습과 PDDL 도메인 자동 획득

최근 연구에서는 기계 학습 기법을 활용하여 PDDL 도메인 모델을 자동으로 학습하거나 개선하는 접근이 활발히 탐구되고 있다. 이러한 연구 방향은 향후 PDDL 표준에 학습된 도메인 모델의 표현과 통합 방식에 영향을 미칠 것으로 예상된다.

5.1 액션 모델 학습

ARMS(Action-Relation Modeling System, Yang et al., 2007), LOCM(Learning Object-Centred Models, Cresswell et al., 2013) 등의 시스템은 플래닝 트레이스(planning trace) 또는 관측 데이터로부터 PDDL 액션 스키마를 자동으로 추론한다. 이러한 학습된 모델은 기존 PDDL 구문으로 표현되지만, 모델의 신뢰도, 불완전성, 점진적 개선 등을 표준적으로 명시하는 메타데이터 체계는 아직 마련되지 않았다.

5.2 대규모 언어 모델을 활용한 도메인 생성

최근에는 대규모 언어 모델(Large Language Model, LLM)을 활용하여 자연어 기술로부터 PDDL 도메인을 자동 생성하는 연구가 진행되고 있다(Liu et al., 2023; Silver et al., 2024). 이러한 접근은 도메인 전문가가 아닌 사용자도 로봇 임무를 자연어로 기술하면 PDDL 도메인이 자동 생성되는 워크플로를 가능하게 한다. 그러나 생성된 도메인의 정확성 검증, 안전성 보장, 표준 준수 여부를 체계적으로 평가하는 프레임워크의 필요성이 제기되고 있다.

6. 로봇 공학 특화 PDDL 확장의 표준화 전망

로봇 공학 분야에서 PDDL의 실질적 활용이 확대됨에 따라, 로봇 시스템에 특화된 도메인 모델링 기능의 표준화가 요구되고 있다. 주요 논의 사항은 다음과 같다.

6.1 실행 의미론의 명시화

고전적 PDDL은 플래닝 시점의 추상 모델만을 정의하며, 계획의 실행 과정에서 발생하는 실패 처리, 재계획 조건, 모니터링 규칙 등을 명시하지 않는다. ROSPlan과 PlanSys2의 경험에 기반하여, 액션 실행의 성공과 실패 조건, 실행 중 모니터링해야 할 불변 조건(invariant), 실패 시 복구 전략 등을 도메인 수준에서 선언할 수 있는 구문의 표준화가 논의되고 있다.

6.2 센서 모델과 관측 가능성

로봇 시스템에서 세계 상태는 센서를 통해 간접적으로 관측된다. 현행 PDDL은 완전 관측 가능(fully observable) 환경을 전제하지만, 실제 로봇은 부분 관측 가능(partially observable) 환경에서 작동한다. 관측 가능성 수준과 센서 모델을 도메인에 명시하는 표준 구문의 도입이 향후 과제로 남아 있다.

6.3 안전 제약과 금지 조건

로봇 시스템의 안전 요구사항을 도메인 수준에서 명시하는 것은 실용적 관점에서 매우 중요하다. PDDL 3.0에서 도입된 제약(constraint)과 선호도(preference) 구문이 이 방향의 초기 시도이지만, 로봇 안전 표준(ISO 10218, ISO 15066 등)에서 요구하는 수준의 안전 제약 표현에는 미치지 못한다. 물리적 충돌 회피, 작업 공간 제한, 속도 한계 등의 안전 제약을 도메인에 통합하는 표준의 개발이 필요하다.

7. 국제 플래닝 경진대회(IPC)의 역할

IPC는 PDDL 표준화의 사실상의 추진체(de facto driving force)로서, 새로운 PDDL 기능의 도입과 검증에 핵심적인 역할을 수행해 왔다. IPC의 각 트랙은 특정 PDDL 기능 집합을 요구함으로써, 해당 기능에 대한 플래너 지원을 촉진하고 실질적인 표준화를 유도한다.

최근 IPC의 주요 트랙 구성은 다음과 같다:

트랙사용 언어주요 특성
ClassicalPDDL (STRIPS/ADL)결정론적 고전 플래닝
TemporalPDDL 2.1시간적 플래닝과 지속 액션
NumericPDDL 2.1수치 플루언트 활용
HTNHDDL계층적 태스크 네트워크
ProbabilisticPPDDL/RDDL확률적 플래닝
LearningPDDL 변형도메인 모델 학습

IPC를 통한 표준화는 학술 커뮤니티의 자발적 합의에 기반하므로, 공식 표준화 기구(ISO, IEEE 등)에 의한 표준화와는 성격이 다르다. 그러나 IPC에서 검증된 언어 기능이 후속 연구와 실제 시스템에 광범위하게 채택됨으로써, 사실상의 표준(de facto standard)으로 기능하는 것이 PDDL 표준화의 전통적 패턴이다.

8. 향후 전망

PDDL 도메인 설계의 표준화는 다음과 같은 방향으로 수렴할 것으로 전망된다.

첫째, 모듈화된 표준 체계의 채택이다. 단일 PDDL 버전이 모든 기능을 포괄하는 방식 대신, 핵심 언어와 선택적 확장 모듈로 구성된 모듈화된 표준 체계가 도입될 가능성이 높다. 이는 :requirements 절의 철학을 확장한 것으로, 각 모듈이 독립적으로 버전 관리되고 플래너가 지원하는 모듈을 선언하는 방식이다.

둘째, 로봇 응용 프로파일의 정의이다. 일반적인 AI 플래닝과 로봇 공학의 요구사항이 분화됨에 따라, 로봇 시스템에 특화된 PDDL 프로파일이 별도로 정의될 수 있다. 이 프로파일은 실행 의미론, 센서 모델, 안전 제약 등 로봇 고유의 기능을 포함한다.

셋째, 도구 생태계의 표준화이다. 도메인 파일의 구문 검증, 의미 분석, 시각화, 자동 생성 등을 지원하는 도구들의 인터페이스와 교환 형식의 표준화가 도메인 설계의 생산성을 높일 것이다. JSON 또는 YAML 기반의 대안적 직렬화 형식도 논의되고 있으며, 이는 S-Expression에 익숙하지 않은 로봇 엔지니어의 접근성을 향상시킬 수 있다.

9. 참고 문헌

  • McDermott, D., Ghallab, M., Howe, A., Knoblock, C., Ram, A., Veloso, M., Weld, D., & Wilkins, D. (1998). “PDDL—The Planning Domain Definition Language.” Technical Report CVC TR-98-003, Yale Center for Computational Vision and Control.
  • Fox, M. & Long, D. (2003). “PDDL2.1: An Extension to PDDL for Expressing Temporal Planning Domains.” Journal of Artificial Intelligence Research, 20, 61–124.
  • Fox, M. & Long, D. (2006). “Modelling Mixed Discrete-Continuous Domains for Planning.” Journal of Artificial Intelligence Research, 27, 235–297.
  • Gerevini, A. & Long, D. (2005). “Plan Constraints and Preferences in PDDL3.” Technical Report, Department of Electronics for Automation, University of Brescia.
  • Holler, D., Behnke, G., Bercher, P., Biundo, S., Fiorino, H., Pellier, D., & Alford, R. (2020). “HDDL: An Extension to PDDL for Expressing Hierarchical Planning Problems.” Proceedings of the AAAI Conference on Artificial Intelligence, 34(06), 9883–9891.
  • Younes, H. L. S. & Littman, M. L. (2004). “PPDDL1.0: An Extension to PDDL for Expressing Planning Domains with Probabilistic Effects.” Technical Report CMU-CS-04-167, Carnegie Mellon University.
  • Sanner, S. (2010). “Relational Dynamic Influence Diagram Language (RDDL): Language Description.” Unpublished manuscript.
  • Kovacs, D. L. (2012). “A Multi-Agent Extension of PDDL3.1.” Proceedings of the 3rd Workshop on the International Planning Competition (WS-IPC).
  • Yang, Q., Wu, K., & Jiang, Y. (2007). “Learning Action Models from Plan Examples Using Weighted MAX-SAT.” Artificial Intelligence, 171(2–3), 107–143.
  • Cresswell, S. N., McCluskey, T. L., & West, M. M. (2013). “Acquiring Planning Domain Models Using LOCM.” The Knowledge Engineering Review, 28(2), 195–213.
  • Liu, B., Jiang, Y., Zhang, X., Liu, Q., Zhang, S., Biber, J., Choi, S., & Zhang, X. (2023). “LLM+P: Empowering Large Language Models with Optimal Planning Proficiency.” arXiv preprint arXiv:2304.11477.
  • Silver, T., Hariprasad, V., Lian, R. S., Holland, G., Tenenbaum, J. B., Ainsworth, T., Lozano-Perez, T., & Kaelbling, L. P. (2024). “PDDL Planning with Pretrained Large Language Models.” NeurIPS 2023 Workshop on Foundation Models for Decision Making.
  • IEEE 1872-2015. (2015). IEEE Standard Ontologies for Robotics and Automation. IEEE Standards Association.