1316.44 플래너 선택을 위한 포트폴리오 접근법

1. 포트폴리오 플래닝의 동기

단일 플래너는 모든 도메인에서 최고의 성능을 보이지 못한다. 특정 도메인에서 탁월한 플래너가 다른 도메인에서는 성능이 떨어지는 것이 일반적이다. 포트폴리오 접근법(portfolio approach)은 여러 플래너를 조합하여 다양한 도메인에서 일관된 높은 성능을 달성하는 전략이다.

2. 포트폴리오의 유형

2.1 시간 분할 포트폴리오(Time-Slicing Portfolio)

주어진 시간 예산을 여러 플래너에 배분하여 순차적 또는 병렬로 실행한다:

총 시간: 300초
  LAMA: 0~100초 (100초)
  FF: 100~200초 (100초)
  Madagascar: 200~300초 (100초)
→ 가장 먼저 해를 찾은 플래너의 결과를 사용

2.2 선택 포트폴리오(Selection Portfolio)

문제의 특성(feature)을 분석하여 가장 적합한 플래너를 선택한다:

features(problem) → classifier → best_planner
  - 변수 수, 액션 수, 그래프 구조 등의 특성 추출
  - 기계 학습 분류기가 최적 플래너 예측
  - 예측된 플래너로 실행

대표적 선택 포트폴리오: Delfi, Fast Downward Stone Soup

2.3 적응형 포트폴리오

실행 중 성능을 모니터링하면서 동적으로 플래너를 전환한다.

3. 포트폴리오 구성 방법

3.1 사전 정의 시간 분할

IPC의 벤치마크 결과를 기반으로 각 플래너의 시간 배분을 최적화한다:

Fast Downward Stone Soup:
  구성 1 (A* + LM-cut): 90초
  구성 2 (GBFS + FF): 90초
  구성 3 (GBFS + CG): 60초
  구성 4 (A* + merge-and-shrink): 60초

3.2 기계 학습 기반 선택

특성 추출: 문제의 구조적 특성(변수 수, 연산자 수, 인과 그래프의 직경 등)을 추출
학습: IPC 벤치마크에서 각 문제-플래너 쌍의 성능 데이터로 분류기를 학습
예측: 새로운 문제에 대해 최적 플래너를 예측하여 선택

4. IPC에서의 포트폴리오 성능

포트폴리오	대회	트랙	성능
Fast Downward Stone Soup	IPC 2011	만족	상위권
Delfi	IPC 2018	비용 최적	상위권
IBaCoP	IPC 2018	만족	1위

포트폴리오 플래너는 개별 플래너보다 광범위한 도메인에서 안정적인 성능을 보인다.

5. 로봇 도메인에서의 포트폴리오 전략

로봇 시스템에서 포트폴리오 접근은 다음과 같이 활용할 수 있다:

임무 유형별 플래너 선택: 이동 중심 임무에는 LAMA, 시간 제약 임무에는 POPF, 최적 비용 임무에는 Scorpion 선택
대안 플래너 자동 전환: 기본 플래너가 시간 내 해를 찾지 못하면 대안 플래너로 자동 전환
PlanSys2에서의 플래너 교체: 런타임에 플래너 플러그인을 교체하여 도메인 특성에 맞는 플래너 사용

6. 참고 문헌

Helmert, M., Röger, G., & Karpas, E. (2011). “Fast Downward Stone Soup: A Baseline for Building Planner Portfolios.” ICAPS Workshop on Planning and Learning.
Seipp, J., Sievers, S., Helmert, M., & Hutter, F. (2015). “Automatic Configuration of Sequential Planning Portfolios.” Proceedings of AAAI, 3364–3370.
Cenamor, I., de la Rosa, T., & Fernández, F. (2018). “IBaCoP and IBaCoP2 Planner.” IPC 2018 Planner Abstracts.