불완전 정보 하에서의 계획 수립 (Planning Under Incomplete Information)

1. 개요

고전적 계획은 완전 관측 가능(fully observable)과 결정론적(deterministic) 가정에 기반하나, 실제 로봇 환경에서는 센서 제한에 의한 부분 관측(partial observability), 행동 결과의 비결정성(non-determinism), 환경 변화에 의한 불확실성(uncertainty)이 존재한다. 불완전 정보 하에서의 계획은 이러한 현실적 제약을 반영하여 견고한(robust) 계획을 생성하는 확장된 계획 프레임워크이다.

2. 불완전 정보의 유형

유형	설명	예시
부분 관측	전체 상태를 관측할 수 없음	문 뒤의 장애물
비결정적 행동	행동 결과가 확정적이지 않음	파지 실패 확률
외생 사건	로봇의 행동과 무관한 환경 변화	사람의 이동
센서 잡음	관측에 오차 포함	GPS 위치 오차

3. 대응 접근 방식

3.1 조건부 계획 (Contingent Planning)

행동 결과의 불확실성을 반영하여, 관측 결과에 따라 분기하는 조건부 계획을 생성한다.

plan:
  1. move(robot, A, B)
  2. observe(door_B_open)
  3. if door_B_open:
       enter(robot, B)
     else:
       move(robot, B, C)
       enter(robot, C)

3.2 확률적 계획 (Probabilistic Planning)

행동 결과에 확률을 부여하고, 기대 비용을 최소화하는 정책(policy)을 탐색한다. 마르코프 의사 결정 과정(MDP)과 부분 관측 MDP(POMDP)가 형식적 프레임워크이다.

3.3 강건한 계획 (Robust Planning)

최악의 경우에도 목표를 달성하는 계획을 생성한다. 모든 가능한 불확실성 실현에 대해 유효한 계획을 탐색한다.

3.4 재계획 (Replanning)

실행 중 예상과 다른 관측이 발생하면, 현재 상태를 갱신하고 새로운 계획을 생성한다.

4. 로봇 공학에서의 실용적 대응

실무에서는 완전한 확률적 계획보다는 다음 접근이 일반적이다.

고전적 계획 + 재계획: 결정론적 가정으로 초기 계획을 생성하고, 실행 중 편차가 발생하면 재계획한다.
행동 트리 기반 예외 처리: 행동 트리의 Fallback과 Retry를 통해 실행 중 실패에 대응한다.
안전 가드: 위험 상황에 대한 즉각적 반응은 하드코딩된 안전 메커니즘으로 처리한다.

5. 참고 문헌

Ghallab, M., Nau, D., & Traverso, P. (2016). Automated Planning and Acting. Cambridge University Press.
Kaelbling, L. P., Littman, M. L., & Cassandra, A. R. (1998). “Planning and Acting in Partially Observable Stochastic Domains.” Artificial Intelligence, 101(1-2), 99-134.

버전	날짜	변경 사항
v0.1	2026-04-05	초안 작성