27.45 기계 학습 기반 난류 예측 기법
기계 학습(machine learning, ML) 기반 난류 예측은 관측 자료, 수치 기상 예보 산물, 과거 항공기 보고 자료 등의 대용량 자료로부터 비선형 통계적 모델을 학습하여 난류의 발생 가능성, 강도, 시공간적 분포를 추정하는 일련의 기법이다. 전통적인 진단 지표 기반 예측이 결정론적 물리 가설에 의존하는 반면, 기계 학습 기반 예측은 자료에 내재된 통계적 패턴을 직접 학습하므로 진단 지표만으로는 표현되지 않는 복합적 난류 발생 메커니즘을 포착할 수 있다는 장점이 있다. 본 절에서는 무인기 운용을 위한 기계 학습 기반 난류 예측 기법의 학술적 분류, 주요 알고리즘, 입력 자료와 출력 표현, 학습 절차, 검증 방법, 한계를 차례로 기술한다.
1. 기계 학습 기반 난류 예측의 학술적 분류
기계 학습 기반 난류 예측은 학습 패러다임에 따라 지도 학습(supervised learning), 비지도 학습(unsupervised learning), 자기 지도 학습(self-supervised learning), 강화 학습(reinforcement learning)으로 분류할 수 있다. 난류 예측 분야에서는 표지(label) 자료로 항공기 EDR(eddy dissipation rate) 보고, PIREP(pilot report), 라이다(LiDAR) 측정 자료가 활용되므로 지도 학습이 주류를 이룬다.
문제 형식에 따라 분류와 회귀로 구분된다. 분류 형식은 난류 강도를 가벼운 난류, 보통 난류, 강한 난류 등 이산적 등급으로 출력하며, 회귀 형식은 EDR 값, TKE, 풍속 변동 표준편차와 같은 연속적 물리량을 출력한다. 또한 출력 영역이 단일 시공간 점인지, 격자 형태의 공간 분포인지, 시간 시퀀스인지에 따라 점 예측(point prediction), 격자 예측(grid prediction), 시계열 예측(sequence prediction)으로 구분된다.
2. 활용되는 입력 자료
기계 학습 기반 난류 예측 모델의 입력 자료는 크게 모델 자료, 관측 자료, 보조 자료로 구분된다. 모델 자료는 수치 기상 예보(numerical weather prediction, NWP)에서 산출된 격자형 풍속, 온도, 비습, 기압, TKE, 진단 지표 등이며, 관측 자료는 항공기 보고, 라디오존데, 윈드 프로파일러, 라이다, 레이더, 위성 자료 등이다. 보조 자료에는 지형 고도(digital elevation model, DEM), 토지 피복(land cover) 분류, 도시 형태(urban morphology) 자료, 식생 거칠기 등이 포함된다.
이러한 다양한 자료원을 통합하기 위해 자료 융합(data fusion) 기법이 적용되며, 자료 간 시간 동기화, 격자 좌표계 일치, 결측 자료 보정, 정규화(normalization)가 전처리 과정에서 수행된다. 또한 시공간적 표현을 보존하기 위해 격자형 자료는 다채널 영상(multi-channel image)으로 변환되어 합성곱 신경망(convolutional neural network, CNN)의 입력으로 활용되는 경우가 많다.
3. 주요 학습 알고리즘
3.1 전통적 기계 학습 기법
전통적 기계 학습 기법으로는 로지스틱 회귀(logistic regression), 서포트 벡터 머신(support vector machine, SVM), 랜덤 포레스트(random forest), 그래디언트 부스팅(gradient boosting) 계열의 알고리즘(XGBoost, LightGBM, CatBoost)이 활용된다. 이들 기법은 비교적 적은 자료에서도 안정적인 성능을 보이며, 특징 중요도(feature importance) 산출이 가능해 해석 가능성이 높다. 특히 그래디언트 부스팅 기반 모델은 다중 진단 지표의 비선형 결합을 자동으로 학습하여 GTG(Graphical Turbulence Guidance) 산물의 후처리(post-processing)에 활용된 사례가 있다.
3.2 심층 신경망 기반 기법
심층 신경망(deep neural network, DNN) 기반 기법은 대용량 자료에서 비선형 시공간 패턴을 효과적으로 학습한다. 격자형 입력에는 합성곱 신경망(convolutional neural network, CNN)이 사용되며, 시계열 입력에는 순환 신경망(recurrent neural network, RNN), 장단기 기억(long short-term memory, LSTM), 게이트 순환 단위(gated recurrent unit, GRU), 시계열 합성곱 신경망(temporal convolutional network, TCN)이 사용된다. 시공간 자료에는 ConvLSTM, 3차원 합성곱 신경망(3D-CNN), 비전 트랜스포머(vision transformer, ViT), 비디오 트랜스포머가 적용된다.
최근에는 트랜스포머(transformer) 구조 기반의 대규모 기상 예측 모델이 발표되었으며, 대표적으로 화웨이 클라우드(Huawei Cloud)의 Pangu-Weather, 엔비디아(NVIDIA)의 FourCastNet, 구글 딥마인드(Google DeepMind)의 GraphCast, ECMWF의 AIFS(Artificial Intelligence Forecasting System) 등이 있다. 이들 모델은 ECMWF의 ERA5 재분석 자료를 학습 자료로 활용하여 전 지구 규모의 풍속, 기압, 기온 등을 직접 예측하며, 풍속 시어 및 난류 진단 지표 산출의 입력 자료로 활용 가능하다.
3.3 물리 정보 신경망
물리 정보 신경망(physics-informed neural network, PINN)은 신경망의 손실 함수에 지배 방정식의 잔차(residual) 항을 추가하여 물리 법칙을 만족하도록 학습시키는 기법이다. 난류 예측 분야에서는 나비에-스토크스 방정식, 연속방정식, 열역학 방정식의 잔차를 손실 함수에 포함시켜 물리적으로 일관된 풍속장과 난류 강도를 예측하는 연구가 수행되었다. PINN은 자료가 희박한 영역에서도 물리 법칙을 통해 외삽이 가능하다는 이점을 가진다.
3.4 가우시안 과정과 베이지안 기법
가우시안 과정(Gaussian process, GP) 회귀와 베이지안 신경망(Bayesian neural network, BNN)은 예측의 불확실성을 정량적으로 산출할 수 있는 확률적 기계 학습 기법이다. 난류 예측에서 불확실성 정량화는 무인기의 임무 가능 여부 판단과 강건 제어 설계에 직접 활용되므로, 베이지안 기법은 결정론적 신경망 대비 학술적·실용적 가치를 가진다.
4. 출력 표현과 후처리
기계 학습 기반 난류 예측 모델의 출력은 EDR 등가값, TKE, 풍속 변동 표준편차, 난류 발생 확률, 난류 등급(예: 가벼운, 보통, 강한, 극심한) 등으로 표현된다. 분류 형식 모델의 경우 출력 확률을 보정(calibration)하여 실제 발생 확률에 부합하도록 조정하는 절차가 필요하며, 플랫(Platt) 스케일링, 등방성 회귀(isotonic regression), 온도 스케일링(temperature scaling) 등이 활용된다.
회귀 형식 모델의 경우 출력 분포의 평균과 분산을 동시에 산출하는 가우시안 우도 손실(Gaussian likelihood loss), 분위수 회귀(quantile regression), 분포 예측(distributional regression) 기법이 적용된다. 산출된 예측 분포는 무인기 비행 계획 시 위험 임계값 초과 확률을 산정하는 데 사용된다.
5. 학습 자료의 구성과 표지
기계 학습 모델의 학습 자료는 입력 자료와 표지(label) 자료의 시공간적 매칭을 통해 구성된다. 표지 자료로는 항공기 보고 자료가 가장 광범위하게 활용되며, 미국 국립환경예측센터(NCEP)와 미국 국립대기연구센터(NCAR)는 IAGOS(In-service Aircraft for a Global Observing System), AMDAR(Aircraft Meteorological Data Relay) 자료를 표준화된 EDR 형태로 수집하여 공개한다.
저고도 무인기의 학습 자료로는 무인기 자체가 보유한 IMU(inertial measurement unit), GNSS, 피토관(Pitot tube)으로부터 산출된 풍속·자세 변동 자료가 활용된다. 이러한 자료는 일반적으로 비행 로그(flight log) 형태로 저장되며, 다수 비행에서 누적된 자료를 표지로 사용하여 모델을 학습한다. 학습 자료의 시공간적 편향(bias)을 줄이기 위해 다양한 기상 조건과 지형 조건에서 수집된 자료가 균형 있게 포함되어야 한다.
6. 학습 절차와 검증 방법
학습 절차는 자료 분할, 모델 정의, 손실 함수 설계, 최적화 알고리즘 선택, 정규화(regularization), 하이퍼파라미터 탐색, 검증 평가의 순서로 구성된다. 자료 분할은 시간적 분할(temporal split) 또는 공간적 분할(spatial split)을 통해 수행되며, 시간적으로 미래의 자료를 검증 자료로 사용하여 모델의 일반화 성능을 평가한다. 무작위 분할은 시공간적 자기 상관(autocorrelation)으로 인해 검증 결과가 과대 평가될 수 있으므로 항공 기상 분야에서는 권장되지 않는다.
평가 지표는 분류의 경우 정밀도(precision), 재현율(recall), F1 점수(F1 score), ROC 곡선 아래 면적(area under the ROC curve, AUC-ROC), 정밀도-재현율 곡선 아래 면적(AUC-PR)이 사용된다. 회귀의 경우 평균 제곱 오차(mean squared error, MSE), 평균 절대 오차(mean absolute error, MAE), 결정 계수(coefficient of determination), 연속 순위 확률 점수(continuous ranked probability score, CRPS)가 사용된다. 항공 기상 분야에서는 표준화된 비교를 위해 EDR 분위수 비교(quantile-quantile comparison)도 활용된다.
7. 무인기 운용에서의 활용
기계 학습 기반 난류 예측은 무인기 운용에서 다음과 같은 형태로 활용된다. 첫째, NWP 산물의 후처리에 활용되어 격자 보정(grid correction)과 편향 제거(bias correction)를 수행한다. 둘째, 무인기에 탑재된 센서 자료를 이용하여 짧은 시간 창에 한정된 초단기 예보(nowcasting)를 산출한다. 셋째, 군집 형태로 운용되는 다수 무인기의 분산 관측 자료를 통합하여 협동 기상 추정(cooperative meteorological estimation)을 수행한다.
특히 도심 환경과 산악 지형에서는 광역 NWP 모델의 격자 해상도 한계로 인해 난류 예측 정확도가 저하되므로, 미시 규모 CFD 모사 자료를 학습 자료로 활용하는 대리 모델(surrogate model) 접근이 활발히 연구되고 있다. CFD 모사는 계산 비용이 매우 높으므로, 신경망을 이용해 풍속장을 근사함으로써 실시간 활용 가능성을 확보할 수 있다.
8. 한계와 학술적 고려 사항
기계 학습 기반 난류 예측은 다음과 같은 한계를 가진다. 첫째, 학습 자료의 분포 외 영역(out-of-distribution, OOD)에서는 예측 신뢰도가 급격히 저하될 수 있다. 둘째, 항공기 EDR 보고 자료는 고고도 영역에 편중되어 있어 저고도 무인기 운용에 직접 활용 시 자료 편향이 발생한다. 셋째, 신경망 기반 모델은 해석 가능성이 낮아 항공 안전 인증(certification) 절차에서의 활용에 제약이 따른다. 넷째, 물리 법칙을 만족하지 않는 비현실적 예측이 산출될 가능성이 있어, PINN과 같은 물리 기반 정규화가 요구된다.
이러한 한계를 보완하기 위해 학습 자료의 다양성 확보, 베이지안 기법을 통한 불확실성 정량화, 물리 정보 손실 함수 설계, 설명 가능한 인공지능(explainable artificial intelligence, XAI) 기법의 적용, 그리고 항공 안전 인증을 위한 개발 및 검증 표준의 정립이 활발히 연구되고 있다. 항공 분야에서는 EUROCAE WG-114와 SAE G-34 등의 표준화 기구가 항공용 인공지능 시스템의 개발 및 검증 절차를 제정하고 있다.
9. 출처
- Williams, J. K., “Using random forests to diagnose aviation turbulence”, Machine Learning, Vol. 95, No. 1, pp. 51–70, 2014.
- Sharman, R. D., Cornman, L. B., Meymaris, G., Pearson, J., and Farrar, T., “Description and derived climatologies of automated in situ eddy-dissipation-rate reports of atmospheric turbulence”, Journal of Applied Meteorology and Climatology, Vol. 53, No. 6, pp. 1416–1432, 2014.
- Bi, K., Xie, L., Zhang, H., Chen, X., Gu, X., and Tian, Q., “Accurate medium-range global weather forecasting with 3D neural networks”, Nature, Vol. 619, pp. 533–538, 2023.
- Lam, R., Sanchez-Gonzalez, A., Willson, M., Wirnsberger, P., Fortunato, M., Alet, F., Ravuri, S., Ewalds, T., Eaton-Rosen, Z., Hu, W., Merose, A., Hoyer, S., Holland, G., Vinyals, O., Stott, J., Pritzel, A., Mohamed, S., and Battaglia, P., “Learning skillful medium-range global weather forecasting”, Science, Vol. 382, No. 6677, pp. 1416–1421, 2023.
- Pathak, J., Subramanian, S., Harrington, P., Raja, S., Chattopadhyay, A., Mardani, M., Kurth, T., Hall, D., Li, Z., Azizzadenesheli, K., Hassanzadeh, P., Kashinath, K., and Anandkumar, A., “FourCastNet: A Global Data-driven High-resolution Weather Model using Adaptive Fourier Neural Operators”, arXiv preprint, arXiv:2202.11214, 2022.
- Raissi, M., Perdikaris, P., and Karniadakis, G. E., “Physics-informed neural networks: A deep learning framework for solving forward and inverse problems involving nonlinear partial differential equations”, Journal of Computational Physics, Vol. 378, pp. 686–707, 2019.
- Brunton, S. L., Noack, B. R., and Koumoutsakos, P., “Machine learning for fluid mechanics”, Annual Review of Fluid Mechanics, Vol. 52, pp. 477–508, 2020.
- Duraisamy, K., Iaccarino, G., and Xiao, H., “Turbulence modeling in the age of data”, Annual Review of Fluid Mechanics, Vol. 51, pp. 357–377, 2019.
- EUROCAE WG-114 / SAE G-34, Process Standard for Development and Certification/Approval of Aeronautical Safety-Related Products Implementing AI (ED-324/ARP6983), 2024.
10. 버전
- 문서 버전: 1.0
- 작성일: 2026-04-18