396.2 임무 관리의 역사적 발전 과정

1. 초기 원격 조종 시대 (1950-1970년대)

로봇 임무 관리의 역사는 원격 조종(Teleoperation) 기술의 발전과 궤를 같이한다. 1950년대 미국 원자력위원회(Atomic Energy Commission)에서 개발된 원격 조작기(Telemanipulator)는 방사능 환경에서의 위험 작업을 위해 설계되었으며, 운용자가 모든 행동을 직접 제어하는 완전 수동 방식이었다(Goertz, 1954). 이 시기에는 임무 관리라는 개념이 독립적으로 존재하지 않았으며, 모든 의사 결정은 인간 운용자에 의해 이루어졌다.

1960년대에 이르러 NASA의 행성 탐사 프로그램은 통신 지연(Communication Delay) 문제를 야기하였다. 지구-달 간 약 1.3초, 지구-화성 간 최대 24분에 달하는 왕복 통신 지연은 완전한 원격 조종을 사실상 불가능하게 만들었으며, 이는 로봇에게 제한적이나마 자율적인 의사 결정 능력을 부여해야 한다는 인식을 촉발시켰다.

$\tau_{\text{delay}} = \frac{2d}{c}$

여기서 $d$ 는 지구와 목표 천체 간의 거리, $c$ 는 전자기파의 전파 속도이다.

2. 군사적 지휘 통제 시스템의 등장 (1970-1980년대)

2.1 DARPA 자율 차량 프로그램

1970년대부터 미국 국방고등연구계획국(DARPA)은 자율 지상 차량(Autonomous Land Vehicle, ALV) 프로그램을 통해 자율 로봇의 임무 관리 문제를 체계적으로 연구하기 시작하였다. 이 프로그램에서는 환경 인식, 경로 계획, 그리고 임무 수준의 의사 결정을 포괄하는 통합 시스템 아키텍처가 처음으로 제안되었다.

2.2 NASREM 아키텍처

1980년대 미국 국립표준기술연구소(NIST)의 Albus(1991)는 NASREM(NASA/NBS Standard Reference Model for Telerobot Control System Architecture)을 제안하였다. NASREM은 로봇 제어 시스템을 계층적으로 구조화한 참조 모델로, 다음과 같은 기능 계층을 정의하였다:

계층	기능	임무 관리 관련 역할
서보 계층	실시간 모터 제어	없음
원시 계층	기본 동작 실행	원자적 행동 실행
요소 작업 계층	단위 작업 제어	과업 구조화
하위 과업 계층	하위 과업 조정	과업 분해
과업 계층	과업 계획 수립	임무 계획 수립
서비스 계층	서비스 관리	임무 목표 관리

이 아키텍처는 임무 관리를 로봇 시스템 아키텍처의 필수적 구성 요소로 공식화한 최초의 시도 중 하나로 평가된다.

2.3 C2 시스템과 OODA 루프

군사 분야에서 Boyd(1987)가 제안한 OODA 루프(Observe-Orient-Decide-Act Loop)는 지휘 통제(Command and Control, C2) 시스템의 의사 결정 과정을 모델화한 프레임워크이다. 이 개념은 로봇 임무 관리에도 직접적으로 적용되었으며, 관측(Observe) → 상황 판단(Orient) → 의사 결정(Decide) → 행동(Act)의 순환 구조는 현대 임무 관리 시스템의 기본 설계 철학으로 계승되었다.

3. 자율 로봇 임무 관리의 태동 (1990년대)

3.1 반응적 아키텍처의 부상

Brooks(1986)의 포섭 구조(Subsumption Architecture)는 전통적인 감지-모델-계획-행동(Sense-Model-Plan-Act, SMPA) 파이프라인에 대한 근본적인 대안을 제시하였다. 포섭 구조는 명시적인 세계 모델 없이 센서 입력에 직접 반응하는 행동 층(Behavior Layer)의 중첩을 통해 복잡한 행동을 생성하였다. 이 접근법은 실시간 반응성에서 우수한 성능을 보였으나, 장기적 목표 추구와 전략적 임무 관리 기능의 부재라는 한계를 드러내었다.

3.2 하이브리드 아키텍처의 발전

반응적 접근법과 숙고적(Deliberative) 접근법의 한계를 극복하기 위해, 1990년대에는 하이브리드 아키텍처(Hybrid Architecture)가 활발히 연구되었다. 대표적인 사례로는 다음과 같은 것들이 있다:

3T 아키텍처 (Three-Tier Architecture)
Gat(1998)이 제안한 3T 아키텍처는 세 개의 계층으로 구성된다:

숙고자(Deliberator): 장기적 계획 수립을 담당하며, 고전적 AI 계획 기법을 활용한다.
시퀀서(Sequencer): 숙고자의 계획을 실행 가능한 행동 시퀀스로 변환하고 실행을 조율한다.
제어기(Controller): 환경과의 실시간 상호작용을 처리한다.

CLARAty 아키텍처
NASA 제트추진연구소(JPL)의 CLARAty(Coupled Layer Architecture for Robotic Autonomy)는 기능 계층(Functional Layer)과 의사 결정 계층(Decision Layer)의 이중 구조를 채택하였다(Volpe et al., 2001). 이 아키텍처는 Mars Exploration Rover 미션에 적용되어 실증되었다.

3.3 Demo III 프로그램

DARPA의 Demo III 프로그램(1990년대 후반)은 무인 지상 차량의 자율 운용을 위한 대규모 연구 프로그램이었다. 이 프로그램에서 개발된 4D/RCS(Four-Dimensional Real-Time Control System) 아키텍처는 NASREM의 후속 모델로, 시간 축을 포함한 4차원적 임무 계획 수립을 지원하였다(Albus, 2002).

4. 다중 로봇 임무 관리의 발전 (2000년대)

4.1 분산 임무 할당

2000년대에 들어서면서 다중 로봇 시스템(Multi-Robot Systems)의 임무 관리 문제가 주요 연구 주제로 부상하였다. Gerkey and Matarić(2004)는 다중 로봇 작업 할당(Multi-Robot Task Allocation, MRTA) 문제를 체계적으로 분류하여, 단일 작업 로봇(Single-Task Robot, ST) 대 다중 작업 로봇(Multi-Task Robot, MT), 단일 로봇 작업(Single-Robot Task, SR) 대 다중 로봇 작업(Multi-Robot Task, MR), 즉시 할당(Instantaneous Assignment, IA) 대 시간 확장 할당(Time-Extended Assignment, TA)의 세 차원으로 구분하였다.

$\text{MRTA 분류}: \begin{cases} \text{로봇 능력}: \text{ST} \vert \text{MT} \\ \text{작업 요구}: \text{SR} \vert \text{MR} \\ \text{할당 시점}: \text{IA} \vert \text{TA} \end{cases}$

4.2 경매 기반 접근법

Dias et al.(2006)은 경매 메커니즘(Auction Mechanism)을 다중 로봇 임무 할당에 적용하는 연구를 체계화하였다. 각 로봇이 작업에 대한 입찰(Bid)을 제출하고, 경매인(Auctioneer)이 최적의 할당을 결정하는 이 방식은 분산 환경에서의 효율적인 임무 배분을 가능하게 하였다.

4.3 CBBA 알고리즘

Choi et al.(2009)이 제안한 CBBA(Consensus-Based Bundle Algorithm)는 합의 기반의 분산 임무 할당 알고리즘으로, 로봇 간 통신을 통한 합의 과정을 거쳐 충돌 없는 임무 할당을 보장하였다. 이 알고리즘은 이후 다수의 후속 연구에서 확장되어 현재까지 널리 사용되고 있다.

5. 형식적 방법론의 도입 (2007년 이후)

5.1 시간 논리 기반 임무 명세

Kress-Gazit et al.(2009)은 선형 시간 논리(LTL)를 활용하여 로봇의 임무를 형식적으로 명세하고, 명세로부터 자동으로 반응적 제어기를 합성하는 방법론을 제안하였다. 이 연구는 임무 관리에 형식적 검증(Formal Verification) 기법을 도입한 선구적 작업으로 평가된다.

5.2 자동화된 계획 수립

PDDL(Planning Domain Definition Language) 기반의 자동화된 계획 수립 기법이 로봇 임무 관리에 본격적으로 적용되기 시작하였다. 특히 Fox and Long(2003)이 제안한 PDDL2.1은 시간적 속성과 수치적 제약을 지원하여, 실제 로봇 임무 계획 수립에 적합한 표현력을 제공하였다.

6. 현대적 임무 관리의 진화 (2010년대 이후)

6.1 행동 트리의 보급

Colledanchise and Ögren(2018)의 연구를 기점으로, 행동 트리(Behavior Tree, BT)가 유한 상태 기계(FSM)의 대안으로 로봇 임무 관리 분야에서 널리 채택되기 시작하였다. 행동 트리는 모듈성(Modularity), 재사용성(Reusability), 반응성(Reactivity)에서의 구조적 우위를 통해 복잡한 임무의 관리를 용이하게 하였다.

6.2 학습 기반 접근법

심층 강화 학습(Deep Reinforcement Learning)의 발전은 임무 관리 분야에도 새로운 패러다임을 제시하였다. 특히 다중 에이전트 강화 학습(Multi-Agent Reinforcement Learning, MARL)은 다중 로봇 임무 관리에서의 협력 전략 학습에 주목할 만한 성과를 보이고 있다.

6.3 대규모 언어 모델의 활용

2020년대에 들어서면서, 대규모 언어 모델(Large Language Model, LLM)을 활용한 자연어 기반 임무 명세와 자동 계획 수립이 새로운 연구 방향으로 대두되고 있다. Ahn et al.(2022)의 SayCan 연구는 LLM의 세계 지식(World Knowledge)과 로봇의 행동 가능성(Affordance)을 결합하여, 자연어 명령으로부터 실행 가능한 임무 계획을 생성하는 가능성을 실증하였다.

7. 발전 과정의 종합적 동향

임무 관리의 역사적 발전 과정은 다음과 같은 방향성을 보여준다:

중앙 집중에서 분산으로: 단일 관리자 기반에서 분산 협력 기반으로의 전환
반응에서 예측으로: 사후 대응적 접근에서 예측적·선행적 접근으로의 진화
수동에서 자율로: 완전 수동 제어에서 점진적으로 높은 수준의 자율성으로의 발전
결정론에서 확률론으로: 결정론적 환경 가정에서 불확실성을 명시적으로 모델링하는 방향으로의 전환
기호에서 신경으로: 기호적(Symbolic) 계획 수립에서 신경망 기반(Neural) 학습으로의 확장

8. 참고 문헌

Ahn, M., Brohan, A., Brown, N., et al. (2022). “Do As I Can, Not As I Say: Grounding Language in Robotic Affordances.” arXiv preprint arXiv:2204.01691.
Albus, J. S. (1991). “Outline for a Theory of Intelligence.” IEEE Transactions on Systems, Man, and Cybernetics, 21(3), 473-509.
Albus, J. S. (2002). “4D/RCS: A Reference Model Architecture for Intelligent Unmanned Ground Vehicles.” Proceedings of the SPIE, 4715, 303-310.
Brooks, R. A. (1986). “A Robust Layered Control System for a Mobile Robot.” IEEE Journal on Robotics and Automation, 2(1), 14-23.
Choi, H. L., Brunet, L., and How, J. P. (2009). “Consensus-Based Decentralized Auctions for Robust Task Allocation.” IEEE Transactions on Robotics, 25(4), 912-926.
Colledanchise, M., and Ögren, P. (2018). Behavior Trees in Robotics and AI: An Introduction. CRC Press.
Dias, M. B., Zlot, R., Kalra, N., and Stentz, A. (2006). “Market-Based Multirobot Coordination: A Survey and Analysis.” Proceedings of the IEEE, 94(7), 1257-1270.
Fox, M., and Long, D. (2003). “PDDL2.1: An Extension to PDDL for Expressing Temporal Planning Domains.” Journal of Artificial Intelligence Research, 20, 61-124.
Gat, E. (1998). “On Three-Layer Architectures.” Artificial Intelligence and Mobile Robots, MIT Press, 195-210.
Gerkey, B. P., and Matarić, M. J. (2004). “A Formal Analysis and Taxonomy of Task Allocation in Multi-Robot Systems.” The International Journal of Robotics Research, 23(9), 939-954.
Goertz, R. C. (1954). “Electronically Controlled Manipulator.” Nucleonics, 12(11), 46-49.
Kress-Gazit, H., Fainekos, G. E., and Pappas, G. J. (2009). “Temporal-Logic-Based Reactive Mission and Motion Planning.” IEEE Transactions on Robotics, 25(6), 1370-1381.
Volpe, R., Nesnas, I., Estlin, T., Mutz, D., Petras, R., and Das, H. (2001). “The CLARAty Architecture for Robotic Autonomy.” Proceedings of the IEEE Aerospace Conference, 1, 121-132.

Version: v1.0 (2026-03-23)