396.13 임무 모니터링(Mission Monitoring) 기능

1. 임무 모니터링의 정의와 목적

임무 모니터링(Mission Monitoring)은 임무 수행의 전 과정을 실시간으로 관찰하고, 계획된 행동과 실제 수행 사이의 편차(Discrepancy)를 감지하며, 이상 상황(Anomaly)을 조기에 탐지하여 상위 의사 결정 모듈에 보고하는 기능이다. 모니터링은 임무 관리 시스템의 감각 기관에 해당하며, 재계획과 비상 대응의 전제 조건이 된다.

형식적으로, 모니터링 함수는 다음과 같이 정의된다:

\mathcal{F}_{\text{mon}}: \mathcal{S}_{\text{actual}}(t) \times \Pi(t) \times \Theta \rightarrow \{\text{Normal}, \text{Deviation}, \text{Warning}, \text{Critical}\}

여기서 \mathcal{S}_{\text{actual}}(t)는 시각 t에서의 실제 시스템 상태, \Pi(t)는 계획된 상태, \Theta는 판정 임계값(Threshold) 집합이다.

2. 모니터링 대상 영역

2.1 임무 진행도 모니터링

임무 진행도(Mission Progress)는 계획된 과업 중 완수된 과업의 비율과 현재 과업의 수행 상태를 종합적으로 평가한다:

\text{Progress}(t) = \frac{\sum_{i=1}^{n} w_i \cdot \text{completion}(t_i, t)}{\sum_{i=1}^{n} w_i}

여기서 w_i는 과업 t_i의 가중치, \text{completion}(t_i, t) \in [0, 1]은 시각 t에서의 과업 t_i의 완수도이다.

진행도 편차(Progress Deviation)는 다음과 같이 측정된다:

\Delta P(t) = \text{Progress}_{\text{planned}}(t) - \text{Progress}_{\text{actual}}(t)

\Delta P(t) > \epsilon_P이면 임무가 일정에 비해 지연되고 있음을 의미한다.

2.2 시스템 건전성 모니터링

로봇의 하위 시스템(센서, 액추에이터, 연산, 통신, 전원)의 건전성을 실시간으로 평가한다. 각 하위 시스템의 건전성 지표는 다음과 같이 정의된다:

h_k(t) = f_k(\mathbf{x}_k(t), \mathbf{x}_k^{\text{nominal}})

여기서 \mathbf{x}_k(t)는 하위 시스템 k의 현재 상태 벡터, \mathbf{x}_k^{\text{nominal}}은 정상 운용 범위이다.

건전성 상태는 다음의 구간으로 분류된다:

건전성 수준값 범위의미대응 행동
정상(Normal)h_k \geq 0.8정상 운용 범위임무 지속
저하(Degraded)0.5 \leq h_k < 0.8성능 저하경고 발생, 과업 조정
경고(Warning)0.2 \leq h_k < 0.5심각한 성능 저하재계획 트리거
위험(Critical)h_k < 0.2기능 상실비상 절차 개시

2.3 환경 상태 모니터링

환경의 동적 변화를 지속적으로 관찰한다. 주요 관찰 항목은 다음과 같다:

  • 동적 장애물의 출현과 이동: 새로운 장애물 감지 시 경로 재계획 트리거
  • 기상 조건의 변화: 풍속, 강수, 시정(Visibility) 등의 변화
  • 위협 요소의 감지: 비인가 접근, 적대적 행동 등
  • 지형의 변화: 지반 상태, 수위 변동 등

2.4 자원 상태 모니터링

핵심 자원의 소비 현황을 추적하고, 잔량 예측을 수행한다:

R_{\text{remaining}}(t) = R_{\text{initial}} - \int_0^t r_{\text{consumption}}(\tau) d\tau

T_{\text{depletion}} = t + \frac{R_{\text{remaining}}(t)}{\bar{r}_{\text{consumption}}}

여기서 \bar{r}_{\text{consumption}}은 평균 자원 소비율이다. 예상 고갈 시점 T_{\text{depletion}}이 임무 종료 예정 시점보다 빠르면 경고를 발생시킨다.

3. 이상 탐지 기법

3.1 규칙 기반 이상 탐지

사전에 정의된 규칙(Rule)에 의해 이상을 판정하는 방법이다:

\text{IF } \text{condition}(\mathbf{x}(t)) \text{ THEN } \text{anomaly\_type}

규칙의 예시:

  • IF E_{\text{remaining}} < E_{\text{threshold}} THEN 에너지 부족 경보
  • IF \Delta_{\text{position}} > d_{\text{max}} THEN 위치 이탈 경보
  • IF \text{comm\_loss\_duration} > T_{\text{comm}} THEN 통신 두절 경보

3.2 통계적 이상 탐지

센서 데이터의 통계적 특성에 기반하여 정상 범위를 벗어나는 값을 이상으로 판정한다. 대표적인 방법으로는 z-점수(z-score) 기반 탐지가 있다:

z(t) = \frac{x(t) - \mu}{\sigma}

|z(t)| > z_{\text{threshold}}이면 이상으로 판정한다.

3.3 모델 기반 이상 탐지

시스템의 동적 모델을 기반으로 예측 상태와 실제 상태 간의 잔차(Residual)를 분석한다:

\mathbf{r}(t) = \mathbf{y}(t) - \hat{\mathbf{y}}(t) = \mathbf{y}(t) - \mathbf{C}\hat{\mathbf{x}}(t)

여기서 \mathbf{y}(t)는 실제 관측, \hat{\mathbf{y}}(t)는 모델 기반 예측, \mathbf{r}(t)는 잔차 벡터이다. 잔차의 노름이 임계값을 초과하면 이상으로 판정한다:

\text{Fault}(t) = \begin{cases} \text{True} & \text{if } \|\mathbf{r}(t)\| > \epsilon_r \\ \text{False} & \text{otherwise} \end{cases}

4. 모니터링 아키텍처

4.1 이벤트 기반 모니터링

이벤트 기반(Event-Driven) 모니터링은 사전에 정의된 이벤트(Event)가 발생할 때만 평가를 수행하여 연산 부하를 절감한다. 이벤트는 상태의 불연속적 변화(센서 트리거, 과업 완료/실패, 타이머 만료 등)에 의해 생성된다.

4.2 주기적 모니터링

주기적(Periodic) 모니터링은 고정 주기 \Delta t로 시스템 상태를 샘플링하여 평가한다. 모니터링 주기의 설정은 나이퀴스트 정리(Nyquist Theorem)에 기반하여, 환경 변화의 최대 빈도보다 높은 샘플링 율을 보장해야 한다:

f_{\text{monitor}} \geq 2 f_{\text{change, max}}

4.3 계층적 모니터링

다수의 모니터링 모듈을 계층적으로 조직하여, 하위 수준에서는 고빈도·저추상 모니터링을, 상위 수준에서는 저빈도·고추상 모니터링을 수행한다:

\text{Monitor}_{L_0}(\Delta t_0) \rightarrow \text{Monitor}_{L_1}(\Delta t_1) \rightarrow \text{Monitor}_{L_2}(\Delta t_2)

여기서 \Delta t_0 < \Delta t_1 < \Delta t_2이다.

5. 경보 관리

모니터링 결과에 따른 경보(Alert)의 생성과 전파를 관리한다. 경보는 심각도(Severity), 긴급도(Urgency), 영향 범위(Scope)에 따라 분류되며, 각 분류에 따라 적절한 대응 절차가 개시된다.

경보의 과다 발생(Alert Fatigue)을 방지하기 위해 다음의 기법이 적용된다:

  • 경보 억제(Alert Suppression): 동일 유형의 반복 경보를 단일 경보로 집약한다.
  • 경보 상관(Alert Correlation): 관련 경보를 그룹화하여 근본 원인을 추론한다.
  • 경보 우선순위화(Alert Prioritization): 심각도와 긴급도에 기반한 우선순위를 부여한다.

6. 참고 문헌

  • Isermann, R. (2006). Fault-Diagnosis Systems: An Introduction from Fault Detection to Fault Tolerance. Springer.
  • Pettersson, O. (2005). “Execution Monitoring in Robotics: A Survey.” Robotics and Autonomous Systems, 53(2), 73-88.
  • Steinbauer, G. (2013). “A Survey about Faults of Robots Used in RoboCup.” RoboCup 2012: Robot Soccer World Cup XVI, Springer, 344-355.

Version: v1.0 (2026-03-23)