학습 기반 계획과의 관계 (Relationship with Learning-Based Planning)

1. 개요

학습 기반 계획(learning-based planning)은 경험 데이터로부터 도메인 모델, 휴리스틱, 정책을 학습하여 태스크 플래닝의 효율성과 적용 범위를 향상시키는 접근이다. 하드코딩, 고전적 자율 계획에 이은 제3의 패러다임으로, 도메인 모델이 불완전하거나 수작업 설계가 어려운 환경에서 유용하다.

2. 학습의 적용 영역

학습 대상	설명	방법
도메인 모델	PDDL 도메인을 경험에서 학습	모델 학습
휴리스틱	계획 탐색 휴리스틱을 학습	지도 학습
정책	상태→행동 매핑을 직접 학습	강화 학습
행동 매개변수	행동의 최적 매개변수를 학습	최적화

3. 고전적 자율 계획과의 비교

특성	고전적 자율 계획	학습 기반 계획
도메인 지식	수작업 PDDL	데이터에서 학습
새 도메인 적응	PDDL 재작성	재학습
보장	최적성/완전성 보장 가능	보장 어려움
일반화	도메인 내 완전	학습 분포에 의존

4. 참고 문헌

Ghallab, M., Nau, D., & Traverso, P. (2016). Automated Planning and Acting. Cambridge University Press.
Jiménez, S., et al. (2012). “A Review of Machine Learning for Automated Planning.” Knowledge Engineering Review, 27(4), 433-467.

버전	날짜	변경 사항
v0.1	2026-04-05	초안 작성