27.48 난류 환경에서의 자율 비행 전략

27.48 난류 환경에서의 자율 비행 전략

자율 비행 전략은 무인기가 외부의 인간 조작자 개입 없이 임무를 수행하기 위해 채택하는 의사 결정 및 행동 계획의 체계이다. 난류 환경에서의 자율 비행 전략은 풍속·돌풍·시어 등의 외란이 비행 안정성, 임무 효율, 안전성에 미치는 영향을 정량적으로 평가하고, 외란을 회피하거나 적극적으로 활용하는 일련의 알고리즘적·아키텍처적 결정을 포함한다. 본 절에서는 난류 환경에서의 자율 비행 전략을 학술적으로 분류하고, 각 전략의 이론적 기초, 구성 요소, 활용 사례, 학술적 한계를 차례로 기술한다.

1. 자율 비행 전략의 학술적 분류

난류 환경에서의 자율 비행 전략은 결정 시점과 정보 활용 방식에 따라 다음과 같이 분류된다.

분류결정 시점정보 활용 방식
사전 계획 전략비행 전NWP 산물 및 통계적 풍속 모델
적응 전략비행 중실시간 측정과 예측의 융합
반응 전략외란 발생 직후즉각적 외란 추정과 제어 보상
학습 기반 전략비행 전·중과거 비행 자료를 학습한 정책

이러한 전략들은 상호 배타적이지 않으며, 실제 자율 비행 시스템에서는 다수의 전략이 계층적으로 결합되어 사용된다. 일반적으로 사전 계획 전략은 임무 계획 모듈에서, 적응 및 반응 전략은 비행 제어 시스템(flight control system, FCS)과 가이던스(guidance) 모듈에서, 학습 기반 전략은 상위 행동 계획(behavior planning) 모듈에서 구현된다.

2. 사전 계획 전략

사전 계획 전략은 임무 수행 전에 가용한 기상 자료와 경로 정보를 바탕으로 비행 경로, 고도 프로파일, 속도 프로파일, 시간 창을 결정하는 전략이다. 이 전략은 풍속·돌풍·시어 분포의 시공간 평균값과 분산을 기반으로 비행 경로의 위험도를 정량화하며, 위험도가 임계값을 초과하는 영역과 시간을 회피하도록 경로를 최적화한다.

수치 기상 예보(numerical weather prediction, NWP) 산물의 격자형 풍속장은 비행 영역의 풍속 벡터, 난류 강도, 돌풍 강도 분포를 제공하며, 이를 비용 함수(cost function)에 결합한 경로 최적화 문제가 정식화된다. 대표적인 정식화로는 그래프 탐색(graph search) 기반의 A* 알고리즘, D* 알고리즘, 동적 계획법(dynamic programming), 비선형 최적 제어(nonlinear optimal control)에 기반한 다이렉트 콜로케이션(direct collocation), 다이렉트 슈팅(direct shooting) 기법이 있다.

기상 자료의 불확실성을 고려한 강건 경로 최적화(robust path optimization)와 확률 제약 최적화(chance-constrained optimization)도 활용된다. 이러한 기법은 앙상블 예보(ensemble forecast)에서 산출된 풍속 분포를 입력으로 하여, 위험 임계값 초과 확률이 사전 정의된 임계 확률 이하가 되는 경로를 산출한다.

3. 적응 전략

적응 전략은 비행 중 실시간으로 갱신되는 측정 자료와 예측 자료를 융합하여 경로, 속도, 자세 명령을 동적으로 조정하는 전략이다. 적응 전략의 핵심은 예측 외란 정보의 신뢰도와 측정 외란 정보의 신뢰도를 균형 있게 결합하는 것이며, 이를 위해 칼만 필터(Kalman filter), 확장 칼만 필터(extended Kalman filter, EKF), 무향 칼만 필터(unscented Kalman filter, UKF), 입자 필터(particle filter), 베이지안 필터(Bayesian filter)가 활용된다.

대표적인 적응 가이던스 기법으로는 모델 예측 제어(model predictive control, MPC) 기반 가이던스가 있다. MPC는 시스템 모델과 외란 예측을 활용해 미래 일정 구간의 비용 함수를 최소화하는 입력을 산출하고, 매 제어 주기마다 새로운 측정 자료를 반영해 최적화 문제를 재해결한다. 난류 환경에서는 외란 예측이 MPC의 비용 함수에 직접 반영되어, 예측된 돌풍을 사전 보상하는 입력이 산출된다.

4. 반응 전략

반응 전략은 외란이 실제로 발생한 직후 즉각적으로 외란을 추정하고 제어 입력을 보상하는 전략으로, 사전 정보가 부족하거나 예측이 어려운 외란에 대응하는 데 활용된다. 반응 전략의 구성 요소는 외란 추정기(disturbance estimator)와 외란 보상기(disturbance compensator)이다.

외란 추정기로는 외란 관측기(disturbance observer, DOB), 미지 입력 관측기(unknown input observer, UIO), 확장 상태 관측기(extended state observer, ESO), 그리고 신경망 기반 추정기 등이 활용된다. 외란 보상기는 추정된 외란을 제어 입력에 음(-)의 부호로 더하는 피드포워드(feedforward) 형태로 구현되며, 이를 통해 외란이 시스템 응답에 미치는 영향이 감쇠된다.

반응 전략은 외란의 시간 척도가 짧은 경우에 특히 효과적이며, 적응 전략과 결합하여 다중 시간 척도(multi-time-scale) 외란 보상 시스템을 구성하는 경우가 많다. 신호의 표본화 주파수와 제어 주기는 외란의 주파수 대역을 충분히 포괄하도록 설정되어야 한다.

5. 학습 기반 전략

학습 기반 전략은 과거 비행 자료 또는 시뮬레이션 자료에서 학습된 정책(policy)을 활용하여 비행 결정과 행동을 산출하는 전략이다. 강화 학습(reinforcement learning, RL), 모방 학습(imitation learning), 메타 학습(meta-learning) 등이 적용되며, 정책은 일반적으로 심층 신경망으로 표현된다.

강화 학습 기반 전략은 환경과의 상호 작용을 통해 누적 보상을 최대화하는 정책을 학습한다. 난류 환경에서는 상태 공간에 풍속 추정값, 외란 예측, 비행체 자세, 위치, 속도가 포함되며, 행동 공간에는 자세 명령, 속도 명령, 추력 명령이 포함된다. 학습 알고리즘으로는 근접 정책 최적화(proximal policy optimization, PPO), 심층 결정론적 정책 경사(deep deterministic policy gradient, DDPG), 소프트 액터-크리틱(soft actor-critic, SAC) 등이 활용된다.

모방 학습은 전문가 조작자의 비행 데이터 또는 최적 제어 알고리즘이 산출한 행동 데이터를 학습하여 정책을 도출한다. 메타 학습은 다양한 난류 환경에서의 빠른 적응을 목표로 하며, 새로운 환경에 노출된 후 적은 양의 자료로 정책을 미세 조정(fine-tuning)할 수 있도록 학습된다.

6. 외란 활용 전략

특정 응용에서는 외란을 회피하기보다는 적극적으로 활용하는 전략이 채택된다. 대표적 사례는 동적 활공(dynamic soaring)으로, 풍속 시어 영역에서 비행체가 시어 사이를 반복 횡단함으로써 추가 에너지를 획득하는 비행 기법이다. 알바트로스(albatross)와 같은 해양 조류가 활용하는 비행 기법으로 알려져 있으며, 무인기 분야에서도 동일한 원리를 활용한 자율 비행 알고리즘이 연구되었다.

또한 산악 지형의 산악파(mountain wave)와 도시 지역의 상승 기류(updraft)를 활용한 정적 활공(static soaring) 또는 열기류 활공(thermal soaring)도 자율 비행 전략에 통합되고 있다. 이러한 전략은 외란 정보를 비용 함수의 음(-)의 항으로 반영하여, 외란을 활용하는 경로가 선호되도록 최적화 문제를 정식화한다.

7. 다층적 결정 아키텍처

실제 무인기 시스템에서는 위에 기술된 전략들이 다층적 결정 아키텍처에 통합되어 운용된다. 일반적인 아키텍처는 다음과 같은 계층으로 구성된다.

최상위 계층인 임무 계획(mission planning) 계층은 사전 계획 전략을 적용하며, 임무 목표와 기상 정보를 바탕으로 비행 경로와 시간 창을 결정한다. 중간 계층인 가이던스 계층은 적응 전략과 학습 기반 전략을 적용하며, 실시간 측정과 예측을 활용해 추적 명령을 산출한다. 최하위 계층인 비행 제어 계층은 반응 전략을 적용하며, 외란 추정과 보상을 통해 자세 및 속도를 안정적으로 유지한다.

각 계층의 결정 주기는 차별화된다. 임무 계획 계층은 분 단위, 가이던스 계층은 초 단위, 비행 제어 계층은 밀리초 단위로 동작하며, 계층 간 정보 전달과 명령 전달은 비동기 통신 방식으로 구현된다. ROS 2와 같은 미들웨어는 이러한 다층적 비동기 통신을 표준화된 방식으로 지원한다.

8. 안전 보장과 검증

자율 비행 전략의 안전 보장은 다음과 같은 방법으로 검증된다. 첫째, 형식적 검증(formal verification) 기법을 적용해 전략이 사전 정의된 안전 조건을 만족함을 수학적으로 증명한다. 대표적 기법으로는 도달 가능 집합 분석(reachability analysis), 모델 검사(model checking), 정리 증명(theorem proving) 등이 있다. 둘째, 몬테카를로 시뮬레이션을 통해 다수의 무작위 시나리오에서 전략의 통계적 안전성을 평가한다. 셋째, 비행 시험을 통해 시뮬레이션 결과의 실증적 검증을 수행한다.

또한 학습 기반 전략의 경우 학습 자료의 분포 외 영역(out-of-distribution, OOD)에서의 안전성 보장이 별도의 학술적 도전 과제이다. 이를 위해 학습된 정책의 출력 범위를 안전 제약(safety constraint) 영역 내로 사후 투영(post-projection)하는 안전 필터(safety filter), 제어 장벽 함수(control barrier function, CBF) 기반 안전 보증 기법, 분포 변화 탐지(distribution shift detection) 기법 등이 연구되고 있다.

9. 자율 비행 전략의 학술적 의의와 한계

난류 환경에서의 자율 비행 전략은 무인기의 운용 가능 영역과 임무 신뢰성을 결정짓는 핵심 요소이다. 사전 계획, 적응, 반응, 학습 기반 전략의 적절한 결합은 다양한 외란 조건에서 비행 안전성과 임무 효율을 동시에 달성하는 데 기여한다. 그러나 다음과 같은 학술적 한계가 존재한다.

첫째, 기상 예측의 불확실성과 시간적 한계로 인해 사전 계획의 신뢰도가 제한된다. 둘째, 측정 외란 정보의 잡음과 지연으로 인해 적응 및 반응 전략의 성능이 제약된다. 셋째, 학습 기반 전략은 학습 자료의 다양성과 품질에 의존적이며, 분포 외 영역에서 예측 불가능한 행동을 보일 수 있다. 넷째, 다층적 아키텍처에서 계층 간 통신 지연과 비동기성으로 인해 결정의 일관성이 손상될 수 있다.

이러한 한계를 보완하기 위해 다중 모델 결합, 베이지안 기반 불확실성 정량화, 안전 필터, 형식적 검증, 비행 시험 자료의 적극적 활용이 권장되며, 이는 다음 절에서 다루는 난류 모델의 실험적 검증 방법으로 자연스럽게 이어진다.

10. 출처

  • Beard, R. W. and McLain, T. W., Small Unmanned Aircraft: Theory and Practice, Princeton University Press, 2012.
  • Stengel, R. F., Flight Dynamics, 2nd edition, Princeton University Press, 2022.
  • Mayne, D. Q., Rawlings, J. B., Rao, C. V., and Scokaert, P. O. M., “Constrained model predictive control: Stability and optimality”, Automatica, Vol. 36, No. 6, pp. 789–814, 2000.
  • Rawlings, J. B., Mayne, D. Q., and Diehl, M. M., Model Predictive Control: Theory, Computation, and Design, 2nd edition, Nob Hill Publishing, 2017.
  • Chen, W.-H., Yang, J., Guo, L., and Li, S., “Disturbance-observer-based control and related methods—An overview”, IEEE Transactions on Industrial Electronics, Vol. 63, No. 2, pp. 1083–1095, 2016.
  • Schulman, J., Wolski, F., Dhariwal, P., Radford, A., and Klimov, O., “Proximal policy optimization algorithms”, arXiv preprint, arXiv:1707.06347, 2017.
  • Sachs, G., “Minimum shear wind strength required for dynamic soaring of albatrosses”, Ibis, Vol. 147, No. 1, pp. 1–10, 2005.
  • Allen, M. J. and Lin, V., “Guidance and control of an autonomous soaring vehicle with flight test results”, AIAA Aerospace Sciences Meeting and Exhibit, AIAA 2007-867, 2007.
  • Ames, A. D., Coogan, S., Egerstedt, M., Notomista, G., Sreenath, K., and Tabuada, P., “Control barrier functions: Theory and applications”, Proceedings of the European Control Conference (ECC), pp. 3420–3431, 2019.
  • Althoff, M., Frehse, G., and Girard, A., “Set propagation techniques for reachability analysis”, Annual Review of Control, Robotics, and Autonomous Systems, Vol. 4, pp. 369–395, 2021.

11. 버전

  • 문서 버전: 1.0
  • 작성일: 2026-04-18