396.70 통신 제한 하의 로컬 임무 자립(Autonomy Abstraction)

1. 개요

원격 관제 환경에서 통신 링크의 단절 또는 열화는 자율 로봇 시스템 운용에서 불가피하게 발생하는 현상이다. 통신 제한 환경에서 로봇이 임무 수행을 지속하기 위해서는, 관제 시스템의 실시간 지시 없이도 자율적으로 임무를 수행·관리할 수 있는 로컬 임무 자립(Local Mission Autonomy) 능력이 필수적이다. 자율성 추상화(Autonomy Abstraction)는 통신 가용성에 따라 자율성 수준을 동적으로 조절하는 체계적 접근법이다. 본 절에서는 통신 제한 하의 로컬 임무 자립 개념, 자율성 추상화 모델, 그리고 구현 전략을 분석한다.

2. 통신 제한의 유형과 특성

2.1 통신 제한의 분류

로봇 운용 환경에서 발생하는 통신 제한은 그 발생 양상에 따라 다음과 같이 분류된다.

유형	특성	발생 환경
완전 단절(Total Loss)	통신이 완전히 차단된다	수중 운용, 지하 구조물 내부, 전자전 환경
간헐적 연결(Intermittent)	통신이 불규칙하게 연결·단절을 반복한다	도심 협곡, 산악 지형, 위성 통신 사각지대
대역폭 제한(Bandwidth-Limited)	통신은 유지되나 전송 가능 데이터량이 극히 제한된다	음향 통신(수중), 장거리 RF, 군집 환경
고지연(High-Latency)	통신은 유지되나 왕복 지연이 과도하다	위성 통신, 심해 운용, 행성 탐사

2.2 통신 품질 모델

통신 링크의 품질을 정량적으로 모델링하면 다음과 같다.

$Q_{\text{link}}(t) = f\left(\text{RSSI}(t), \text{BER}(t), \text{RTT}(t), \text{BW}(t)\right)$

여기서 $\text{RSSI}(t)$ 는 수신 신호 강도, $\text{BER}(t)$ 는 비트 오류율, $\text{RTT}(t)$ 는 왕복 지연 시간, $\text{BW}(t)$ 는 가용 대역폭이다. 통신 품질 $Q_{\text{link}}$ 는 0(완전 단절)에서 1(이상적 품질) 사이의 정규화된 값으로 표현된다.

$Q_{\text{link}}(t) = w_1 \cdot \hat{R}(t) + w_2 \cdot (1 - \hat{B}(t)) + w_3 \cdot \hat{T}^{-1}(t) + w_4 \cdot \hat{W}(t)$

여기서 $\hat{R}$ , $\hat{B}$ , $\hat{T}$ , $\hat{W}$ 는 RSSI, BER, RTT, BW의 정규화 값이며, $w_1 + w_2 + w_3 + w_4 = 1$ 이다.

3. 자율성 추상화(Autonomy Abstraction) 모델

3.1 개념적 정의

자율성 추상화는 로봇의 자율성 수준을 통신 가용성에 따라 동적으로 조절하는 패러다임이다. 통신이 양호할 때에는 운영자가 세밀한 제어를 수행하고(낮은 자율성), 통신이 제한될 때에는 로봇이 사전 정의된 정책에 따라 독립적으로 임무를 수행한다(높은 자율성).

$\text{LOA}(t) = g\left(Q_{\text{link}}(t), \sigma_{\text{mission}}(t), \rho_{\text{risk}}(t)\right)$

여기서 $\text{LOA}(t)$ 는 시각 $t$ 에서의 자율성 수준(Level of Autonomy), $Q_{\text{link}}(t)$ 는 통신 품질, $\sigma_{\text{mission}}(t)$ 는 현재 임무 상태, $\rho_{\text{risk}}(t)$ 는 환경 위험도이다.

3.2 자율성 수준 전이 모델

자율성 수준의 전이는 다음의 상태 기계로 모델링된다.

자율성 수준	명칭	통신 요구	운영자 역할	로봇 역할
LOA 1	원격 제어(Teleoperation)	연속적, 고대역폭	직접 조작	명령 실행
LOA 2	감독 제어(Supervisory)	주기적, 중대역폭	목표 지시, 승인	계획 수립, 승인 후 실행
LOA 3	위임 임무(Delegated)	간헐적, 저대역폭	임무 할당, 예외 처리	자율 계획, 자율 실행
LOA 4	합의 기반(Consensual)	극히 간헐적	높은 수준 목표만 제시	완전 자율 수행, 보고
LOA 5	완전 자율(Full Autonomy)	불필요	개입 불가	독립적 판단과 실행

자율성 수준 간의 전이 조건은 다음과 같이 정의된다.

$\text{LOA}_{k} \rightarrow \text{LOA}_{k+1} \iff Q_{\text{link}}(t) < \theta_{k}^{\downarrow} \text{ for } \Delta t > \tau_k$

$\text{LOA}_{k+1} \rightarrow \text{LOA}_{k} \iff Q_{\text{link}}(t) > \theta_{k}^{\uparrow} \text{ for } \Delta t > \tau_k$

여기서 $\theta_{k}^{\downarrow}$ 와 $\theta_{k}^{\uparrow}$ 는 각각 상향 전이와 하향 전이의 임계값이며, $\tau_k$ 는 전이 지연 시간(히스테리시스)으로서 빈번한 전이 진동을 방지한다. 상향 전이 임계값이 하향 전이 임계값보다 높은 히스테리시스 구간을 두어 안정성을 확보한다.

$\theta_{k}^{\uparrow} > \theta_{k}^{\downarrow}$

4. 로컬 임무 자립의 구현 전략

4.1 사전 적재 임무 계획(Pre-loaded Mission Plan)

통신 단절에 대비하여, 임무 수행 전에 완전한 임무 계획을 로봇에 사전 적재하는 전략이다. 사전 적재 계획에는 다음의 요소가 포함된다.

주 임무 계획(Primary Plan): 정상 조건에서 실행할 기본 임무 경유점과 행동 시퀀스이다.
대체 경로(Alternative Paths): 주 경로의 실행이 불가능할 경우 사용할 대안 경로이다.
비상 행동 정책(Failsafe Policy): 통신 단절 시간에 따른 단계적 비상 행동을 정의한다.
의사 결정 규칙(Decision Rules): 환경 변화에 따른 자율적 판단 기준을 사전 정의한다.

사전 적재 계획의 완전성(Completeness)은 다음과 같이 평가된다.

$C_{\text{plan}} = \frac{|\mathcal{S}_{\text{covered}}|}{|\mathcal{S}_{\text{possible}}|}$

여기서 $\mathcal{S}_{\text{covered}}$ 는 계획에 의해 대처 가능한 상황의 집합, $\mathcal{S}_{\text{possible}}$ 는 발생 가능한 전체 상황의 집합이다. 이상적으로 $C_{\text{plan}} \rightarrow 1$ 이나, 실제로는 환경의 불확실성으로 인해 완전한 사전 계획은 불가능하다.

4.2 조건부 임무 계획(Contingency Planning)

사전 적재 계획의 한계를 보완하기 위해, 조건부 분기를 포함하는 임무 계획을 사용한다. 조건부 임무 계획은 결정 트리(Decision Tree) 또는 조건부 행동 트리(Conditional Behavior Tree)로 표현된다.

$\text{Plan}_{\text{contingency}} = \{(c_1 \rightarrow p_1), (c_2 \rightarrow p_2), \ldots, (c_n \rightarrow p_n), (\text{default} \rightarrow p_{\text{safe}})\}$

여기서 $c_i$ 는 환경 조건, $p_i$ 는 해당 조건에서 실행할 부분 계획, $p_{\text{safe}}$ 는 어떤 조건에도 해당하지 않을 경우의 안전 계획이다.

4.3 로컬 재계획 능력(Local Replanning Capability)

통신이 단절된 상태에서 예기치 않은 상황이 발생할 경우, 로봇이 탑재된 계산 자원을 활용하여 자율적으로 경로 및 임무를 재계획하는 능력이다. 로컬 재계획의 범위는 자율성 수준에 따라 결정된다.

자율성 수준	로컬 재계획 범위
LOA 2	경로의 국소적 변경 (장애물 회피)
LOA 3	경유점 순서 변경, 새로운 경유점 추가·삭제
LOA 4	임무 과업의 재순서화, 과업 추가·삭제
LOA 5	새로운 임무 목표의 자율적 설정

로컬 재계획의 의사 결정은 다음의 유용도 최적화 문제로 형식화된다.

$\pi^* = \arg\max_{\pi \in \Pi} \mathbb{E}\left[\sum_{t=0}^{T} \gamma^t \cdot r(s_t, \pi(s_t))\right]$

여기서 $\pi$ 는 정책(Policy), $\Pi$ 는 가능한 정책의 집합, $s_t$ 는 시각 $t$ 에서의 상태, $r(s_t, \pi(s_t))$ 는 보상 함수, $\gamma$ 는 할인 계수이다.

4.4 통신 복구 시 동기화(Resynchronization on Communication Recovery)

통신이 복구된 후에는 로봇의 자율 수행 결과와 관제 시스템의 기대 상태 간의 불일치를 해소하는 동기화 절차가 필요하다. 동기화 프로세스는 다음의 단계로 구성된다.

상태 보고: 로봇이 통신 단절 기간 동안의 행동 이력과 현재 상태를 관제 시스템에 일괄 전송한다.
차이 분석: 관제 시스템이 원래 계획과 실제 수행 결과 간의 차이를 분석한다.
계획 갱신: 차이에 기반하여 잔여 임무 계획을 갱신하거나, 운영자에게 판단을 요청한다.
자율성 수준 하향: 통신이 안정적으로 복구되면 자율성 수준을 점진적으로 하향 조정하여 운영자의 관제를 복원한다.

5. 통신 인식 임무 관리(Communication-Aware Mission Management)

5.1 통신 품질 예측

로봇의 이동 경로를 따라 통신 품질이 어떻게 변화할 것인지를 사전에 예측하는 것은 자율성 전이의 사전 대비를 가능하게 한다. 통신 품질 예측 모델은 다음과 같다.

$\hat{Q}_{\text{link}}(\mathbf{p}, t) = h\left(\mathbf{p}, \text{Map}_{\text{RF}}, \text{Weather}(t), \text{Topology}(t)\right)$

여기서 $\mathbf{p}$ 는 로봇의 예상 위치, $\text{Map}_{\text{RF}}$ 는 무선 주파수 전파 지도(RF Propagation Map), $\text{Weather}(t)$ 는 기상 조건, $\text{Topology}(t)$ 는 네트워크 토폴로지이다.

5.2 통신 인식 경로 계획

임무 경로의 계획 시 통신 품질을 목적 함수에 포함시켜, 가능한 한 통신이 양호한 경로를 선택하는 전략이다.

$\text{Path}^* = \arg\min_{\text{Path}} \left[ \alpha \cdot C_{\text{distance}}(\text{Path}) + \beta \cdot C_{\text{energy}}(\text{Path}) - \gamma \cdot \int_{\text{Path}} Q_{\text{link}}(\mathbf{p}) \, ds \right]$

여기서 $C_{\text{distance}}$ 는 경로 거리 비용, $C_{\text{energy}}$ 는 에너지 비용, $Q_{\text{link}}(\mathbf{p})$ 는 경로 상의 통신 품질이며, $\alpha, \beta, \gamma$ 는 각각의 가중치이다.

5.3 데이터 우선순위 관리

대역폭이 제한된 상황에서 전송할 데이터의 우선순위를 관리하는 체계이다.

우선순위	데이터 유형	전송 조건
최고	비상 상황 알림, 비상 명령	항시 전송
높음	핵심 상태 (위치, 에너지)	주기적 전송
중간	임무 진행 상태, 이벤트	대역폭 가용 시 전송
낮음	상세 텔레메트리, 센서 데이터	여유 대역폭 존재 시 전송
최저	로그 데이터, 영상 스트림	통신 복구 후 일괄 전송

6. 비상 행동 정책(Failsafe Policy)

6.1 단계적 비상 행동

통신 단절 시간의 경과에 따라 단계적으로 적용되는 비상 행동 정책은 다음과 같다.

$a_{\text{failsafe}}(t) = \begin{cases} \text{임무 계속} & \text{if } \Delta t_{\text{lost}} < T_1 \\ \text{현위치 대기} & \text{if } T_1 \leq \Delta t_{\text{lost}} < T_2 \\ \text{자동 귀환} & \text{if } T_2 \leq \Delta t_{\text{lost}} < T_3 \\ \text{비상 착륙/정지} & \text{if } \Delta t_{\text{lost}} \geq T_3 \end{cases}$

여기서 $\Delta t_{\text{lost}}$ 는 마지막 유효 통신 이후의 경과 시간, $T_1, T_2, T_3$ 는 사전 설정된 임계 시간이다. 각 임계 시간은 임무의 성격, 운용 환경의 위험도, 에너지 잔량 등을 고려하여 설정된다.

6.2 에너지 인식 비상 행동

비상 행동의 선택에 에너지 잔량을 고려한다.

$a_{\text{failsafe}} = \begin{cases} \text{자동 귀환} & \text{if } E_{\text{remaining}} \geq E_{\text{return}} + E_{\text{margin}} \\ \text{비상 착륙} & \text{if } E_{\text{remaining}} < E_{\text{return}} + E_{\text{margin}} \end{cases}$

여기서 $E_{\text{remaining}}$ 은 현재 에너지 잔량, $E_{\text{return}}$ 은 귀환에 필요한 예상 에너지, $E_{\text{margin}}$ 은 안전 여유 에너지이다.

7. 참고 문헌

Clough, B. T. (2002). Metrics, Schmetrics! How the Heck Do You Determine a UAV’s Autonomy Anyway? Proceedings of the Performance Metrics for Intelligent Systems Workshop, Gaithersburg, MD.
Parasuraman, R., Sheridan, T. B., & Wickens, C. D. (2000). A Model for Types and Levels of Human Interaction with Automation. IEEE Transactions on Systems, Man, and Cybernetics, Part A, 30(3), 286–297.
Scherer, J., Rinner, B., Yahyanejad, S., Hayat, S., Yanmaz, E., Andre, T., … & Bettstetter, C. (2015). An Autonomous Multi-UAV System for Search and Rescue. Proceedings of the First Workshop on Micro Aerial Vehicle Networks, Systems, and Applications for Civilian Use, Florence, Italy, 33–38.
Murphy, R. R. (2004). An Introduction to AI Robotics. MIT Press.
Prorok, A., Malencia, M., Carlone, L., Sukhatme, G. S., Sadler, B. M., & Kumar, V. (2021). Beyond Robustness: A Taxonomy of Approaches towards Resilient Multi-Robot Systems. arXiv preprint arXiv:2109.12343.

본 절은 로봇공학 Volume 9, Part 53, Chapter 396의 일부로서, 통신 제한 환경에서의 로컬 임무 자립과 자율성 추상화 메커니즘을 서술한다. v1.0