행동 순서의 최적화 가능성 (Optimization Potential of Action Sequencing)
1. 개요
자율 계획의 중요한 장점 중 하나는 계획기가 비용 함수에 기반하여 최적 또는 준최적의 행동 순서를 자동으로 탐색할 수 있다는 것이다. 하드코딩 방식에서는 개발자의 직관에 의해 행동 순서가 결정되므로, 복잡한 다단계 임무에서 최적성을 보장하기 어렵다.
2. 최적화의 차원
2.1 행동 수 최소화
목표를 달성하는 데 필요한 행동의 수를 최소화한다.
\pi^* = \arg\min_{\pi} |\pi|, \quad \text{subject to } \gamma(s_0, \pi) \in G
비용 최소화
각 행동에 비용이 할당된 경우, 총 비용을 최소화하는 계획을 탐색한다.
\pi^* = \arg\min_{\pi} \sum_{a \in \pi} \text{cost}(a)
2.2 시간 최소화
시간적 계획에서 병렬 실행 가능한 행동을 식별하여 총 소요 시간을 최소화한다.
3. 하드코딩과의 비교
3.1 물류 로봇 배달 순서 최적화
5개 물품을 다른 위치로 배달하는 임무에서:
| 접근 | 배달 순서 | 총 이동 거리 |
|---|---|---|
| 하드코딩 (입력 순서) | A→B→C→D→E | 35m |
| 자율 계획 (최적화) | B→D→A→E→C | 22m |
| 최적 (TSP 근사) | C→E→A→D→B | 18m |
자율 계획기는 비용 함수(이동 거리)를 고려하여 더 효율적인 순서를 자동으로 탐색한다.
3.2 조립 작업 순서 최적화
여러 부품을 조립하는 작업에서, 부품 간 의존성(부품 A를 먼저 장착해야 부품 B 장착 가능)을 고려한 최적 순서를 자동 탐색한다.
4. 비용 함수의 유형
| 비용 유형 | 설명 | 적용 분야 |
|---|---|---|
| 단위 비용 | 모든 행동의 비용이 1 | 행동 수 최소화 |
| 이동 거리 | 이동 행동의 거리 비례 비용 | 물류, 내비게이션 |
| 에너지 소모 | 배터리 소모 비례 비용 | 드론, 이동 로봇 |
| 시간 | 행동 소요 시간 비례 비용 | 시간 제약 임무 |
| 위험도 | 행동의 안전 위험 비례 비용 | 안전 중시 임무 |
5. 최적 계획기
| 계획기 | 최적성 | 접근 방식 |
|---|---|---|
| A* 기반 (예: LAMA) | 최적/준최적 | 휴리스틱 탐색 |
| 비용 최적 FF | 준최적 | 완화 그래프 + 비용 |
| OPTIC | 최적 | 시간적 비용 최적화 |
6. 설계 시 고려 사항
6.1 최적성과 계산 시간의 트레이드오프
최적 계획의 탐색은 계산 비용이 높다. 실시간 요구가 있는 경우 준최적(satisficing) 계획기를 사용하여 계산 시간을 단축한다.
6.2 비용 모델의 정확도
비용 함수가 실제 비용을 정확히 반영하지 못하면, “최적” 계획이 실제로는 최적이 아닐 수 있다.
7. 참고 문헌
- Ghallab, M., Nau, D., & Traverso, P. (2016). Automated Planning and Acting. Cambridge University Press.
- Helmert, M. (2006). “The Fast Downward Planning System.” JAIR, 26, 191-246.
| 버전 | 날짜 | 변경 사항 |
|---|---|---|
| v0.1 | 2026-04-05 | 초안 작성 |