후방 탐색 플래닝 알고리즘 (Backward Search Planning Algorithms)

1. 개요

후방 탐색(backward search) 플래닝은 목표 상태 $G$ 에서 시작하여, 해당 조건을 달성할 수 있는 행동을 역방향으로 추적하며 초기 상태에 도달하는 경로를 탐색하는 알고리즘이다. 목표 관련(goal-relevant) 행동에 집중하여 탐색 공간을 축소할 수 있다.

2. 기본 원리

2.1 회귀 (Regression)

목표 조건 $G$ 에서 행동 $a$ 를 역적용하여 선행 상태(predecessor state)를 도출한다.

$\text{regress}(G, a) = (G \setminus \text{Add}(a)) \cup \text{Pre}(a)$

이는 “목표 $G$ 를 달성하기 위해 행동 $a$ 를 마지막으로 실행한다면, 직전에 충족되어야 하는 조건은 무엇인가?“에 대한 답이다.

적용 가능 조건

행동 $a$ 가 목표 $G$ 에 대해 역적용 가능하려면:

$\text{Add}(a) \cap G \neq \emptyset$ : 행동의 추가 효과가 목표의 일부를 달성
$\text{Del}(a) \cap G = \emptyset$ : 행동의 삭제 효과가 목표를 파괴하지 않음

알고리즘

function BackwardSearch(P = ⟨S, A, γ, s₀, G⟩):
    Open = {G}
    while Open ≠ ∅:
        g = selectAndRemove(Open)
        if g ⊆ s₀:
            return reconstructPlan(g)
        for each action a relevant to g:
            g' = regress(g, a)
            Open = Open ∪ {g'}
    return FAILURE

전방 탐색과의 비교

특성	전방 탐색	후방 탐색
시작점	초기 상태 $s_0$	목표 조건 $G$
확장 방향	미래 (행동 적용)	과거 (행동 역적용)
노드 표현	완전 상태	부분 상태 (서브골)
탐색 집중	모든 적용 가능 행동	목표 관련 행동만
분기 계수	적용 가능한 행동 수	목표 관련 행동 수
현대 계획기에서의 채택	주류 (FF, Fast Downward)	제한적

장점과 한계

장점

목표 관련 행동에 집중하여 탐색 공간 축소
큰 초기 상태에서 작은 목표 조건으로의 탐색에 효율적

한계

부분 상태 표현의 복잡성
상호 배타(mutex) 관계 처리의 어려움
효율적 휴리스틱 설계의 어려움
대부분의 현대 계획기는 전방 탐색을 선호

참고 문헌

Ghallab, M., Nau, D., & Traverso, P. (2016). Automated Planning and Acting. Cambridge University Press.
Russell, S., & Norvig, P. (2020). Artificial Intelligence: A Modern Approach. 4th ed. Pearson.

버전	날짜	변경 사항
v0.1	2026-04-05	초안 작성