396.59 자율성 수준별 임무 관리 전략
1. 개요
자율 로봇 시스템의 자율성 수준(Level of Autonomy, LoA)은 임무 관리 시스템의 설계 구조, 의사결정 흐름, 그리고 인간-로봇 상호작용 패턴을 근본적으로 결정한다. 단일 로봇이라 하더라도 자율성 수준에 따라 임무 계획의 구체성, 실행 중 감시의 밀도, 재계획의 주체와 빈도가 상이하게 구성되어야 한다. 본 절에서는 자율성 수준을 범주화하고, 각 수준에 대응하는 임무 관리 전략의 아키텍처, 의사결정 메커니즘, 통신 프로토콜을 체계적으로 분석한다.
2. 자율성 수준의 범주화와 전략 매핑
2.1 자율성 수준 범주
임무 관리 전략을 수립하기 위해, 자율성 수준을 다음의 다섯 범주로 분류한다. 이 범주화는 Sheridan-Verplank(1978)의 10단계 모델과 ALFUS 프레임워크를 종합하여 임무 관리의 관점에서 재구성한 것이다.
| 범주 | 자율성 범위 (\alpha) | 명칭 | 의사결정 주체 |
|---|---|---|---|
| L1 | 0 \leq \alpha < 0.2 | 원격 조종(Teleoperation) | 인간 |
| L2 | 0.2 \leq \alpha < 0.4 | 보조적 자율(Assisted Autonomy) | 인간 + 시스템 보조 |
| L3 | 0.4 \leq \alpha < 0.6 | 감시적 자율(Supervisory Autonomy) | 시스템 + 인간 감시 |
| L4 | 0.6 \leq \alpha < 0.8 | 조건부 자율(Conditional Autonomy) | 시스템 (제한 조건 하) |
| L5 | 0.8 \leq \alpha \leq 1.0 | 완전 자율(Full Autonomy) | 시스템 |
각 범주는 임무 관리의 핵심 기능인 계획(planning), 실행(execution), 모니터링(monitoring), 재계획(replanning)에서의 기능 배분(function allocation)을 규정한다.
3. L1: 원격 조종 수준의 임무 관리 전략
3.1 아키텍처 특성
원격 조종 수준에서 임무 관리 시스템은 운영자의 직접 제어 명령을 수신하여 하위 제어 시스템에 전달하는 명령 중계기(command relay) 역할을 수행한다. 이 수준에서의 임무 관리는 상대적으로 단순한 2계층 아키텍처(명령 수신 – 실행)로 구성된다.
3.2 임무 계획
임무 계획은 운영자가 전적으로 수행한다. 임무 관리 시스템은 운영자가 생성한 경유점(waypoint) 목록, 행동 시퀀스, 타이밍 제약 등을 수신하고, 실행 가능성 검증(feasibility check)만을 수행한다.
실행 가능성 검증 함수 V: \mathcal{P} \rightarrow \{0, 1\}는 제출된 계획 p \in \mathcal{P}에 대해 다음을 확인한다:
V(p) = \begin{cases} 1 & \text{if } \forall c_i \in \mathcal{C}: \text{constraint}(c_i, p) = \text{true} \\ 0 & \text{otherwise} \end{cases}
여기서 \mathcal{C}는 물리적 제약 조건 집합(작동 범위, 최대 속도, 에너지 한계 등)이다.
3.3 실행과 모니터링
실행은 운영자의 실시간 조이스틱 입력 또는 단순 명령의 순차적 실행으로 이루어진다. 임무 관리 시스템은 원격 측정(telemetry) 데이터를 운영자에게 실시간 전송하며, 기본적인 안전 제한(safety limiter)만을 자체적으로 적용한다.
3.4 통신 요구사항
원격 조종 수준은 가장 높은 통신 대역폭과 낮은 지연 시간(latency)을 요구한다. 통신 지연 \tau_{\text{comm}}이 임계값 \tau_{\text{max}}를 초과하면 안정적 제어가 불가능해지므로, 다음의 조건이 충족되어야 한다:
\tau_{\text{comm}} + \tau_{\text{processing}} < \tau_{\text{max}}
전형적으로, 비행 로봇의 원격 조종에서 \tau_{\text{max}}는 200ms 이하로 설정된다.
4. L2: 보조적 자율 수준의 임무 관리 전략
4.1 아키텍처 특성
보조적 자율 수준에서 임무 관리 시스템은 운영자의 의사결정을 보조하는 지능형 조언자(intelligent advisor) 역할을 수행한다. 시스템은 상황 분석, 대안 생성, 위험 평가 등의 기능을 제공하되, 최종 결정권은 운영자에게 있다.
4.2 임무 계획
운영자가 고수준 임무 목표를 설정하면, 임무 관리 시스템은 이를 달성하기 위한 복수의 실행 계획 후보(candidate plans) \{p_1, p_2, \ldots, p_K\}를 생성하여 운영자에게 제시한다. 각 계획에 대해 예상 소요 시간, 에너지 소비량, 위험도 등의 평가 정보를 함께 제공한다.
계획 후보 p_k의 종합 평가 점수 S(p_k)는 다음과 같이 산출된다:
S(p_k) = \sum_{j=1}^{M} w_j \cdot f_j(p_k)
여기서 w_j는 평가 기준 j의 가중치, f_j(p_k)는 평가 기준 j에 대한 계획 p_k의 점수이다. 운영자는 이 점수와 부가 정보를 참고하여 최종 계획을 선택한다.
4.3 실행과 모니터링
실행은 로봇이 자율적으로 수행하되, 핵심 결정점(decision point)에서는 운영자의 승인(approval)을 요청한다. 이를 인간 계약 루프(Human-in-the-Loop) 실행 모델이라 한다. 모니터링은 시스템이 자동으로 수행하며, 이상 감지 시 운영자에게 경보를 발송한다.
4.4 재계획
재계획의 필요성이 감지되면, 시스템은 수정된 후보 계획들을 생성하여 운영자에게 제시한다. 시간 제약이 엄격한 경우, 시스템은 가장 높은 평가 점수를 가진 계획을 자동 실행하고 사후에 운영자의 검토(review)를 요청할 수 있다.
5. L3: 감시적 자율 수준의 임무 관리 전략
5.1 아키텍처 특성
감시적 자율 수준에서 임무 관리 시스템은 독립적 실행자(independent executor) 역할을 수행한다. 시스템은 계획 수립부터 실행까지를 자율적으로 수행하며, 운영자는 감시자(supervisor)로서 필요 시 개입한다. 이 수준은 Sheridan(1992)이 정의한 감시적 제어(supervisory control)의 핵심 영역에 해당한다.
5.2 임무 계획
운영자는 고수준 목표(예: “A 구역 정찰 후 B 구역 물품 배송”)만을 지정하고, 임무 관리 시스템이 세부 계획을 자율적으로 수립한다. 계층적 작업 네트워크(Hierarchical Task Network, HTN) 계획기를 활용하여 고수준 과업을 세부 행동으로 분해하고, 최적 실행 순서를 결정한다.
HTN 분해 과정에서 임무 m은 다음과 같이 재귀적으로 분해된다:
m \rightarrow \langle t_1, t_2, \ldots, t_n \rangle \rightarrow \langle a_{1,1}, a_{1,2}, \ldots, a_{n,k_n} \rangle
여기서 t_i는 중간 과업(intermediate task), a_{i,j}는 기본 행동(primitive action)이다.
5.3 실행과 모니터링
실행은 완전히 자율적으로 이루어진다. 임무 관리 시스템은 행동 트리(Behavior Tree) 또는 상태 머신(FSM)을 통해 행동 시퀀스를 제어하며, 실시간으로 임무 진행 상태를 모니터링한다.
운영자에게는 주기적 상태 요약 보고(periodic status summary)가 전송되며, 비정상 상황 발생 시 즉각적 경보가 전달된다. 운영자의 개입은 다음의 조건에서 요청된다:
- 시스템의 불확실성이 허용 임계값을 초과할 때
- 임무 목표의 해석에 모호성이 존재할 때
- 윤리적 또는 법적 판단이 필요한 상황
- 다른 에이전트 또는 인간과의 예상치 못한 상호작용 발생
5.4 재계획
재계획은 시스템이 자율적으로 수행한다. 환경 변화 또는 예기치 못한 장애 발생 시, 임무 관리 시스템은 현재 상황을 반영한 새로운 계획을 생성하고 즉시 실행한다. 재계획의 결과는 운영자에게 사후 통보된다.
재계획 트리거와 실행의 자율성은 다음과 같이 정의된다:
\text{Replan}(t) = \begin{cases} \text{Autonomous} & \text{if } \Delta_{\text{plan}} < \delta_{\text{threshold}} \\ \text{Request Approval} & \text{if } \Delta_{\text{plan}} \geq \delta_{\text{threshold}} \end{cases}
여기서 \Delta_{\text{plan}}은 원래 계획과 새 계획 사이의 차이 정도를 나타내는 지표이고, \delta_{\text{threshold}}는 운영자 승인이 필요한 변경 수준의 임계값이다.
6. L4: 조건부 자율 수준의 임무 관리 전략
6.1 아키텍처 특성
조건부 자율 수준에서 임무 관리 시스템은 자기 관리 에이전트(self-managing agent) 역할을 수행한다. 시스템은 정의된 운용 범위(Operational Design Domain, ODD) 내에서 완전히 자율적으로 동작하며, ODD를 벗어나는 상황에서만 인간 개입을 요청한다.
운용 범위의 형식적 정의는 다음과 같다:
\text{ODD} = \{(\mathbf{x}_{\text{env}}, \mathbf{x}_{\text{sys}}, \mathbf{x}_{\text{mission}}) : \phi_{\text{ODD}}(\mathbf{x}_{\text{env}}, \mathbf{x}_{\text{sys}}, \mathbf{x}_{\text{mission}}) = \text{true}\}
여기서 \phi_{\text{ODD}}는 운용 범위를 정의하는 논리 술어이다. 현재 상태가 ODD에 포함되는지 여부를 실시간으로 평가하여 자율 운용의 적합성을 판단한다.
6.2 임무 계획과 목표 설정
L4 수준에서는 시스템이 주어진 상위 목적(mission objective)으로부터 구체적 임무 목표를 자체적으로 도출할 수 있다. 이는 목적-목표 매핑(objective-to-goal mapping) 추론 엔진을 통해 구현된다.
\mathcal{G} = \text{Derive}(\text{Objective}, \text{Context}, \text{Constraints})
여기서 \mathcal{G}는 시스템이 도출한 구체적 목표 집합이다.
6.3 자기 평가와 메타 인지
L4 수준의 핵심 역량은 자기 평가(self-assessment)와 메타 인지(meta-cognition)이다. 시스템은 자신의 현재 능력, 자원 상태, 불확실성 수준을 지속적으로 평가하고, 이를 기반으로 자율 운용의 지속 여부를 결정한다.
자기 평가 함수 \Psi는 다음과 같이 정의된다:
\Psi(t) = \sum_{i=1}^{N} \lambda_i \cdot \psi_i(t)
여기서 \psi_i(t)는 개별 역량 지표(센서 건전성, 계산 자원 가용성, 모델 신뢰도 등)이고, \lambda_i는 가중치이다. \Psi(t) < \Psi_{\text{min}}이면 자율성 수준을 하향 조정한다.
7. L5: 완전 자율 수준의 임무 관리 전략
7.1 아키텍처 특성
완전 자율 수준에서 임무 관리 시스템은 자율 의사결정 에이전트(autonomous decision-making agent)로서, 임무의 전 과정을 인간의 개입 없이 독립적으로 수행한다. 이 수준은 현재 대부분의 로봇 시스템에서 연구 단계에 있으며, 제한된 환경에서의 특수 임무에 적용 사례가 존재한다.
7.2 목적 수준 임무 명세
L5 수준에서의 임무 명세는 최상위 목적(purpose) 수준에서 이루어진다. 예를 들어, “이 농장의 생산성을 최적화하라“와 같은 추상적 목적이 제시되면, 시스템은 이를 구체적 임무, 과업, 행동으로 자율적으로 분해한다.
이 과정은 다음의 추상화 계층을 거쳐 수행된다:
\text{Purpose} \xrightarrow{\text{Reasoning}} \text{Objectives} \xrightarrow{\text{Planning}} \text{Missions} \xrightarrow{\text{Decomposition}} \text{Tasks} \xrightarrow{\text{Scheduling}} \text{Actions}
7.3 지속적 학습과 적응
L5 수준의 임무 관리 시스템은 지속적 학습(continual learning)을 통해 임무 수행 능력을 점진적으로 향상시킨다. 과거 임무 수행 데이터를 분석하여 계획 전략을 개선하고, 새로운 환경 패턴을 학습하며, 실패 사례를 통해 고장 대응 능력을 강화한다.
학습 기반 정책 갱신은 다음과 같이 표현된다:
\pi_{k+1} = \text{Update}(\pi_k, \mathcal{D}_{\text{experience}_k}, \mathcal{L})
여기서 \pi_k는 현재 정책, \mathcal{D}_{\text{experience}_k}는 k번째 임무까지의 경험 데이터, \mathcal{L}은 학습 알고리즘이다.
8. 자율성 수준 전환의 안전 관리
8.1 전환 시 인간 요인 고려
자율성 수준의 전환, 특히 상향 전환(자율성 증가) 후 하향 전환(인간에게 제어 복귀)이 발생하는 경우, 운영자의 상황 인식(Situation Awareness, SA) 저하가 심각한 안전 문제를 초래할 수 있다. Endsley(1995)의 SA 모델에 따르면, 자율 시스템에 제어를 위임한 운영자는 시간이 경과함에 따라 환경 인식 수준이 저하된다.
SA 저하 모델은 다음과 같이 표현된다:
SA(t) = SA_0 \cdot e^{-\beta(t - t_{\text{handoff}})}
여기서 SA_0는 초기 상황 인식 수준, \beta는 감쇠율, t_{\text{handoff}}는 제어 위임 시점이다.
운영자에게 제어가 복귀될 때, 충분한 SA 복구 시간 T_{\text{SA}}를 확보하기 위해 다음의 절차를 적용한다:
- 사전 알림(Pre-notification): 예상 전환 시점 이전에 운영자에게 전환 예고
- 정보 브리핑(Information Briefing): 현재 상태, 진행 중인 임무, 환경 조건의 요약 제공
- 점진적 전환(Gradual Transition): 자율성 수준을 단계적으로 하향하여 운영자의 적응을 지원
- 전환 검증(Handover Verification): 운영자의 SA 수준이 적절한지 확인 후 전환 완료
8.2 전환 프로토콜의 형식적 검증
자율성 수준 전환 프로토콜의 정확성은 형식적 검증(formal verification)을 통해 보장한다. 전환 프로토콜을 시간 오토마톤(timed automaton)으로 모델링하고, 안전 속성(safety property)과 활동성 속성(liveness property)을 TCTL(Timed Computation Tree Logic)로 명세한 후, 모델 검사(model checking) 도구를 통해 검증한다.
핵심 안전 속성은 다음과 같다:
\Box(\text{transition\_in\_progress} \Rightarrow \Diamond_{\leq T_{\text{max}}} \text{transition\_complete})
이는 “전환이 시작되면 반드시 T_{\text{max}} 시간 내에 완료되어야 한다“는 것을 의미한다.
9. 참고 문헌
- T. B. Sheridan, “Telerobotics, Automation, and Human Supervisory Control,” MIT Press, 1992.
- T. B. Sheridan and W. L. Verplank, “Human and Computer Control of Undersea Teleoperators,” MIT Man-Machine Systems Laboratory, 1978.
- M. R. Endsley, “Toward a Theory of Situation Awareness in Dynamic Systems,” Human Factors, vol. 37, no. 1, pp. 32–64, 1995.
- NIST, “Autonomy Levels for Unmanned Systems (ALFUS) Framework,” NIST Special Publication 1011-I-2.0, 2008.
- G. A. Dorais, R. P. Bonasso, D. Kortenkamp, B. Pell, and D. Schreckenghost, “Adjustable Autonomy for Human-Centered Autonomous Systems,” Proceedings of the IJCAI Workshop on Adjustable Autonomy Systems, 1999.
- R. Parasuraman, T. B. Sheridan, and C. D. Wickens, “A Model for Types and Levels of Human Interaction with Automation,” IEEE Transactions on Systems, Man, and Cybernetics—Part A, vol. 30, no. 3, pp. 286–297, 2000.
- E. K. Gat, “On Three-Layer Architectures,” Artificial Intelligence and Mobile Robots, MIT Press, pp. 195–210, 1998.
version: 1.0