조건부 플래닝과 비결정적 환경 (Contingent Planning and Non-Deterministic Environments)
1. 개요
조건부 플래닝(contingent planning)은 행동의 결과가 비결정적이고 관측이 불완전한 환경에서, 관측 결과에 따라 분기하는 조건부 계획을 생성한다.
2. 조건부 계획의 구조
선형 시퀀스가 아닌 분기 트리(branching tree) 형태이다.
행동 A 실행
├── 관측 결과 1 → 행동 B
└── 관측 결과 2 → 행동 C
3. 비결정적 행동의 모델
\gamma(s, a) \in \{s'_1, s'_2, \ldots, s'_k\}
행동 a의 결과가 k개의 가능한 상태 중 하나이다.
강건 계획과 약한 계획
| 유형 | 보장 |
|---|---|
| 강건 계획 (strong plan) | 모든 가능한 결과에서 목표 달성 보장 |
| 강한 순환 계획 (strong cyclic) | 무한 재시도 하에 목표 달성 보장 |
| 약한 계획 (weak plan) | 일부 결과에서만 목표 달성 |
참고 문헌
- Ghallab, M., Nau, D., & Traverso, P. (2016). Automated Planning and Acting. Cambridge University Press.
| 버전 | 날짜 | 변경 사항 |
|---|---|---|
| v0.1 | 2026-04-05 | 초안 작성 |