지난 몇 년간 인공지능(AI) 분야는 GPT-3와 같은 대형언어모델(Large Language Model, LLM)의 출현으로 전례 없는 발전을 경험했다. 딥러닝 기술의 등장은 모델을 구성하는 매개변수(parameter)의 수를 기하급수적으로 증가시켰으며, 이는 3.5개월마다 2배씩 성장하여 18개월마다 2배씩 증가하는 무어의 법칙을 뛰어넘는 속도였다.1 GPT-3는 1,750억 개의 매개변수를 통해 인간과 거의 동등한 수준의 언어 능력을 보여주며, 다양한 분야에서 그 활용 가능성을 입증했다.1 이러한 초거대 AI의 성공은 딥러닝 알고리즘, 특히 병렬 처리에 용이한 트랜스포머(Transformer) 아키텍처와 자기지도학습(self-supervised learning)의 꾸준한 발전이 누적된 결과물이다.1
하지만 이러한 성공에도 불구하고, 현재의 초거대 AI는 근본적인 한계에 직면해 있다. 대부분의 LLM은 방대한 텍스트 데이터로부터 언어적 패턴을 학습하는 데 특화되어 있어, 우리를 둘러싼 물리적 세계의 법칙이나 인과관계를 내재적으로 이해하지 못한다. 이로 인해 모델의 편향성, 대규모 데이터 학습에 따르는 비효율성, 그리고 학습된 지식을 새로운 상황에 적용하는 외삽(extrapolation) 능력의 부족과 같은 문제들이 지속적으로 제기되고 있다.1
이러한 한계를 질적으로 혁신하기 위한 노력의 일환으로, AI 연구의 패러다임은 단순한 데이터 패턴 학습을 넘어 물리적 현실을 이해하고 예측하는 방향으로 전환되고 있다. 이 전환의 중심에는 인간처럼 시각, 청각 등 여러 감각 정보를 통합적으로 처리하는 ‘멀티모달 AI(Multimodal AI)’ 1와, 한 걸음 더 나아가 물리적 환경과의 상호작용을 직접 모델링하고 물리 법칙을 학습에 통합하는 ‘피지컬 AI(Physical AI)’가 자리 잡고 있다.4 이는 AI가 가상 세계의 데이터를 넘어 실제 세계의 작동 원리를 이해하는 새로운 단계로 진입하고 있음을 시사한다.
‘피지컬 AI(Physical AI)’는 물리적 세계와 상호작용하며 실질적인 문제를 해결하는 인공지능 시스템을 총칭하는 개념이다.4 이는 단순히 데이터를 처리하고 결과를 생성하는 것을 넘어, 센서(카메라, 라이다 등)를 통해 주변 환경을 인지하고, 수집된 데이터를 바탕으로 물리 법칙에 기반한 의사결정을 내리는 능력을 포함한다. 자율주행차, 로보틱스, 드론과 같이 실제 환경에서 자율적으로 작동해야 하는 AI 에이전트(AI Agent)들이 피지컬 AI의 대표적인 예시다.4 피지컬 AI의 핵심은 데이터 기반의 복잡한 물리 법칙을 모델에 반영하여, 예측 불가능한 변수가 가득한 현실 세계에서 신뢰성 있고 정교한 시스템을 구현하는 데 있다.4
이러한 피지컬 AI의 비전을 실현하기 위한 구체적인 청사진으로 ‘월드 파운데이션 모델(World Foundation Model, WFM)’이라는 개념이 제시되었다.4 NVIDIA에 의해 제안된 WFM은 물리적 세계의 복잡성을 이해하고 예측하도록 설계된 대규모 AI 모델을 의미한다. WFM의 목표는 다양한 환경과 상황에서 AI가 물리 법칙을 스스로 학습하고 이를 실시간으로 적용하여, 자율주행차나 로봇이 겪게 될 수많은 시나리오를 가상 환경에서 정밀하게 시뮬레이션하는 것이다.4 이는 AI가 특정 과업 수행을 넘어 ‘세계’ 자체를 이해하는 하나의 기반(foundation)을 갖추게 함으로써, 범용 인공지능(AGI, Artificial General Intelligence)으로 나아가는 중요한 발판이 될 수 있다.4
피지컬 AI와 WFM의 등장은 자연스럽게 ‘과학을 위한 파운데이션 모델(Foundation Models for Science)’이라는 더 큰 개념으로 확장된다. 이는 자연어 처리(NLP)나 컴퓨터 비전 분야에서 GPT나 CLIP과 같은 파운데이션 모델이 보여준 성공에서 영감을 얻은 것이다.7 과학을 위한 파운데이션 모델은 방대한 과학 데이터(e.g., 실험 데이터, 시뮬레이션 결과, 과학 문헌)로 사전학습(pre-training)된 후, 특정 과학 분야의 세부 과제(downstream task)들, 예를 들어 신물질의 물성 예측이나 새로운 분자 구조 생성 등에 미세조정(fine-tuning)을 통해 적응할 수 있는 대규모 AI 모델을 지칭한다.7
하지만 이 분야는 현재 일종의 정체성 혼란을 겪고 있다. ‘파운데이션 모델’이라는 용어가 명확한 학술적 합의 없이 무분별하게 사용되면서, 특정 물리계에 대한 고성능 ‘대리 모델(surrogate model)’과 진정한 의미의 파운데이션 모델 간의 경계가 모호해지고 있기 때문이다.8 LLM의 ‘일반성’이 다양한 언어 과제를 처리하는 능력이라면, 과학 분야에서의 진정한 ‘일반성’은 다양한 물리 법칙이나 시스템에 걸쳐 작동하는 능력이어야 한다.
따라서 진정한 과학 파운데이션 모델은 단순히 모델의 크기(scale)가 큰 것을 넘어, 다음과 같은 핵심적인 특성을 갖추어야 한다.8
이는 전통적인 수치해석 방법론인 유한요소법(FEM)이나 유한체적법(FVM)이 특정 문제에 국한되지 않고 광범위한 공학 문제에 적용되는 범용성과 철학을 공유한다.8 결국 이 분야가 한 단계 더 성숙하기 위해서는, 고성능 대리 모델과 진정한 파운데이션 모델을 구분할 수 있는 엄격한 벤치마크와 평가 기준을 수립하는 것이 시급하다. 미래 연구는 단일 시스템의 정확도 향상을 넘어, 여러 물리 도메인을 아우르는 재사용 가능하고 확장 가능한 모델 개발에 집중되어야 하며, 이는 연구의 방향성을 ‘더 깊게’ 파고드는 것에서 ‘더 넓게’ 확장하는 것으로의 전환을 요구한다.
물리 인공지능의 발전은 단순히 더 많은 데이터를 학습시키는 것을 넘어, 물리 세계의 근본적인 원리를 모델 아키텍처와 학습 과정에 통합하려는 독창적인 기술적 시도들에 의해 뒷받침된다. 물리 정보 신경망(PINN), 그래프 신경망(GNN), 트랜스포머, 등변 신경망, 그리고 뉴럴 오퍼레이터는 각각 다른 방식으로 물리적 제약을 AI 모델에 주입하며, 이는 모델의 성능, 일반화 능력, 계산 효율성 간의 근본적인 트레이드오프를 결정한다.
물리 정보 신경망(Physics-Informed Neural Networks, PINN)은 딥러닝 모델 훈련에 물리 법칙을 직접적으로 통합하는 혁신적인 접근법이다.10 순수 데이터 기반 모델이 입력과 출력 데이터 간의 관계만을 학습하는 것과 달리, PINN은 신경망의 손실 함수(loss function)에 물리 법칙을 나타내는 편미분방정식(PDE)이나 상미분방정식(ODE)의 잔차항(residual)을 포함시킨다.10
PINN의 손실 함수는 일반적으로 다음과 같이 구성된다:
\(L_{total} = L_{data} + \lambda L_{physics}\) 여기서 $L_{data}$는 관측된 데이터와 모델 예측값 사이의 오차를 측정하는 항이며, $L_{physics}$는 모델 예측값이 지배 방정식을 얼마나 잘 만족하는지를 측정하는 물리 정보 항이다.10 이때 PDE의 미분항은 신경망의 역전파 원리에 기반한 자동 미분(Automatic Differentiation)을 통해 효율적으로 계산된다.10
$L_{physics}$ 항은 레이블이 없는 임의의 좌표점(collocation points)에서도 계산될 수 있어, 일종의 비지도 학습(unsupervised learning) 방식으로 작동한다.10
이러한 구조 덕분에 PINN은 여러 장점을 가진다.
이러한 장점을 바탕으로 PINN은 전산유체역학(나비에-스토크스 방정식) 10, 구조역학(탄성 방정식) 10, 열전달 10, 분자 동역학 11, 혈류 역학 13, 심지어 COVID-19 확산 모델링(SIR 모델) 15과 같은 매우 다양한 과학 및 공학 분야에 성공적으로 적용되고 있다.
하지만 PINN 역시 완벽하지는 않다. 복잡한 PDE의 경우 학습 과정이 불안정하고 수렴이 어려울 수 있으며, 현재로서는 전통적인 고정밀 수치 시뮬레이션에 비해 정확도가 다소 낮은 경우가 많다.14 이러한 한계를 극복하기 위해, 최근에는 전통적인 시뮬레이션 방법과 PINN을 결합하여 정확도와 속도의 균형을 맞추려는 하이브리드 시뮬레이션 연구가 활발히 진행되고 있다.14
물리 시스템은 다수의 구성요소들이 서로 상호작용하며 복잡한 동역학을 만들어내는 네트워크로 볼 수 있다. 이러한 시스템의 구조와 관계를 효과적으로 모델링하기 위해 그래프 신경망(GNN)과 트랜스포머 아키텍처가 핵심적인 역할을 수행한다.
GNN의 물리적 귀납적 편향 (Physical Inductive Bias of GNNs)
GNN은 물리 시스템을 모델링하는 데 매우 자연스러운 구조를 제공한다. 시스템의 구성요소(e.g., 입자, 원자)를 노드(node)로, 이들 간의 상호작용(e.g., 힘, 결합)을 엣지(edge)로 표현하는 그래프 구조는 물리적 직관과 잘 부합한다. GNN의 핵심 메커니즘인 메시지 패싱(message passing)은 각 노드가 자신의 이웃 노드로부터 정보를 받아 상태를 업데이트하는 과정으로, 이는 물리 세계의 ‘국소적 상호작용(local interaction)’ 원리를 강력한 귀납적 편향(inductive bias)으로 모델에 주입한다.16 이러한 구조적 제약 덕분에 GNN은 순수 데이터 기반 모델보다 적은 데이터로도 효율적인 학습이 가능하며, 더 나은 일반화 성능을 보인다. 최근 연구들은 한 걸음 더 나아가, 뉴턴의 운동 법칙과 같은 2차 미분 법칙이나 시스템의 연속적인 상태 변화와 같은 물리적 편향을 GNN 아키텍처에 직접 통합하려는 시도(e.g., SEGNO)를 통해 모델의 일반화 성능을 획기적으로 개선하고 있다.17
트랜스포머의 확장성 (Scalability of Transformers)
트랜스포머 아키텍처는 셀프 어텐션(self-attention) 메커니즘을 통해 데이터 내 모든 요소 쌍 간의 관계를 직접 계산함으로써, 데이터의 장거리 의존성(long-range dependency)을 포착하는 데 탁월한 능력을 보여준다.1 또한, 연산의 병렬 처리 효율성이 매우 높아 수천억 개 이상의 파라미터를 갖는 초거대 모델을 구축하는 데 핵심적인 기반 기술이 되었다.1 기상 예측과 같은 시공간 데이터를 처리하기 위해, 3D Swin Transformer와 같은 변형 아키텍처가 개발되었다. 이 모델은 3차원 체적 데이터(volumetric data)를 작은 3D 패치(patch)로 나눈 뒤, 지역적인 3D 윈도우 내에서 어텐션을 계산함으로써 계산 효율성을 유지하면서도 공간적, 시간적 패턴을 효과적으로 학습한다.21
아키텍처 비교: GraphCast (GNN) vs. Pangu-Weather (Transformer)
이 두 아키텍처의 특성은 기상 예측 분야의 대표적인 두 모델, GraphCast와 Pangu-Weather에서 명확하게 드러난다.
두 모델 모두 기존의 최고 성능 수치예보모델(NWP)인 유럽중기예보센터(ECMWF)의 통합예보시스템(IFS)을 능가하는 정확도를 보여주었다.32 여러 연구에서 GNN 기반의 GraphCast가 더 많은 지표에서 Pangu-Weather보다 우수한 성능을 보였다고 보고되었지만 32, 특정 태풍 경로 예측과 같은 일부 사례에서는 Pangu-Weather가 더 나은 결과를 보이기도 해 34, 어떤 아키텍처가 절대적으로 우월하다고 단정하기는 이르다. 이는 문제의 특성에 따라 최적의 아키텍처가 달라질 수 있음을 시사한다.
등변성(Equivariance)의 중요성
물리 법칙은 대칭성(symmetry)을 갖는다. 예를 들어, 뉴턴의 운동 법칙은 좌표계가 회전하거나 평행 이동하더라도 동일하게 적용된다. 이러한 변환에 대해 시스템의 예측이 일관되게 변해야 하는 성질을 ‘등변성(equivariance)’이라고 한다. 등변 신경망(Equivariant Neural Networks, ENN)은 이러한 물리적 대칭성 제약을 모델 아키텍처 자체에 명시적으로 내장한 것이다.17 모델이 데이터로부터 대칭성을 배우도록 하는 대신, 아키텍처 수준에서 이를 강제함으로써 데이터 효율성과 일반화 성능을 극적으로 향상시킬 수 있다. 특히 원자의 3차원 좌표를 직접 다루는 분자 동역학이나 재료 과학 분야에서 등변성은 모델의 물리적 타당성을 보장하는 필수적인 요소로 간주된다.36
뉴럴 오퍼레이터 (Neural Operators)
뉴럴 오퍼레이터는 물리 AI의 패러다임을 한 단계 더 발전시킬 잠재력을 지닌 기술이다. 기존의 신경망이 유한 차원의 벡터 공간 사이의 매핑(e.g., 이미지 픽셀 벡터를 클래스 레이블 벡터로 매핑)을 학습하는 반면, 뉴럴 오퍼레이터는 무한 차원의 함수 공간 사이의 매핑, 즉 ‘연산자(operator)’를 학습한다.39
이를 물리 문제에 적용하면, 특정 초기 조건이나 경계 조건 함수가 주어졌을 때 그에 해당하는 해(solution) 함수를 출력하는 전체적인 ‘해 연산자(solution operator)’를 학습하는 것과 같다. 예를 들어, 유체 시뮬레이션에서 유입 속도 분포 함수를 입력받아 전체 유동장 속도 분포 함수를 출력하는 연산자를 학습할 수 있다. 이렇게 학습된 모델은 훈련 데이터에서 보지 못했던 완전히 새로운 입력 함수(e.g., 새로운 형태의 유입 속도 분포)에 대해서도 해를 예측할 수 있어, 기존 모델들보다 훨씬 뛰어난 일반화 능력을 보인다.
최근에는 물리 정보(Physics-informed) 개념을 뉴럴 오퍼레이터에 결합한 PI-GANO(Physics-informed Geometry-aware Neural Operator), PI-Latent-NO(Physics-informed Latent Neural Operator) 등의 연구가 등장하고 있다.39 이들은 데이터 없이 오직 물리 법칙(PDE 잔차)만으로 훈련하거나, 매우 적은 데이터로 고차원 PDE 문제를 효율적으로 해결할 수 있는 가능성을 보여주며, 물리 AI의 새로운 지평을 열고 있다.
이처럼 물리 AI의 핵심 기술들은 ‘데이터’에 ‘물리적 제약’을 어느 수준에서, 어떻게 주입할 것인가에 대한 다양한 접근법을 제시한다. 순수 데이터 기반의 트랜스포머에서 시작하여, 구조적 편향을 가진 GNN과 등변 신경망, 명시적 법칙을 강제하는 PINN, 그리고 함수 공간의 관계 자체를 학습하는 뉴럴 오퍼레이터에 이르기까지, 이 기술들은 상호 보완적인 관계에 있다. 미래의 가장 강력한 물리 AI 모델은 특정 문제의 성격(알려진 물리 법칙의 유무, 데이터의 양, 요구되는 일반화 수준)에 따라 이러한 기술들을 모듈식으로 결합하는 하이브리드 형태가 될 가능성이 높다.
Table 1: 주요 거대 물리 인공지능 모델 개요
| 모델명 (Model Name) | 개발 기관 (Developer) | 핵심 아키텍처 (Core Architecture) | 주요 응용 분야 (Primary Application) | 핵심 혁신 (Key Innovation) |
|---|---|---|---|---|
| GraphCast | Google DeepMind | 그래프 신경망 (GNN) | 중기 기상 예측 | 다중 스케일 그래프 메시(icosahedron mesh)를 통한 전 지구적 패턴 학습 26 |
| Pangu-Weather | Huawei | 3D Swin Transformer | 기상 예측 | 3D 트랜스포머를 통한 고도별 대기층 간의 상호작용 모델링 21 |
| FourCastNet | NVIDIA | 푸리에 뉴럴 오퍼레이터 (FNO) | 기상/기후 시뮬레이션 | PDE를 푸리에 공간에서 학습하여 계산 효율성 증대 31 |
| Modulus | NVIDIA | 물리 정보 신경망 (PINN) 기반 | 디지털 트윈, 공학 시뮬레이션 | 물리 법칙 기반 AI 모델 개발을 위한 통합 프레임워크 제공 45 |
| AlphaFold | Google DeepMind | 어텐션 기반 (Evoformer) | 단백질 구조 예측 | 아미노산 서열로부터 3D 구조를 End-to-End로 정확하게 예측 1 |
| GNoME | Google DeepMind | 그래프 신경망 (GNN) | 신소재 발견 | 대규모 계산을 통해 안정적인 무기 결정 구조 예측 및 데이터베이스 구축 46 |
| MatterGen | Microsoft | 확산 모델 (Diffusion Model) | 신소재 생성 | 원하는 물성에 맞는 새로운 안정적인 재료 구조를 생성하는 역설계 48 |
| Graphormer | Microsoft | 트랜스포머 (GNN 기반) | 분자 물성 예측, 신약 개발 | 분자의 그래프 구조 정보를 트랜스포머 아키텍처에 효과적으로 통합 49 |
물리 인공지능 모델은 이론적 가능성을 넘어 기상 예측, 재료 과학, 로보틱스 등 다양한 분야에서 실질적인 성과를 창출하며 과학적 발견의 속도와 규모를 혁신하고 있다. 이는 전통적인 연구 방법론이 직면했던 근본적인 병목 현상, 즉 막대한 시간과 계산 비용 문제를 해결함으로써 가능해졌다. AI의 진정한 가치는 단순히 기존 시뮬레이션을 대체하는 것을 넘어, ‘탐색의 경제학’을 바꾸어 과학 연구의 패러다임을 ‘깊이 있는 소수 가설 검증’에서 ‘광범위한 다수 가설 탐색’으로 전환시키는 데 있다.
Table 2: 전통적 수치 시뮬레이션과 AI 기반 물리 시뮬레이션 비교
| 구분 (Dimension) | 전통적 수치 시뮬레이션 (e.g., FEM/CFD) | AI 기반 물리 시뮬레이션 (e.g., PINN/GraphCast) |
|---|---|---|
| 방법론 | 지배방정식의 이산화 및 수치해석 | 데이터로부터 패턴 또는 연산자 학습 |
| 계산 비용 | 높음 (고성능 컴퓨팅(HPC) 필수) | 높음 (훈련 시) / 매우 낮음 (추론 시) |
| 예측 속도 | 느림 (문제 복잡도에 따라 시간/일 소요) | 매우 빠름 (추론 시 실시간에 가까움) |
| 정확도 | 높음 (물리 법칙을 엄밀하게 보장) | 데이터 및 모델 구조에 따라 가변적 |
| 데이터 의존성 | 낮음 (물리 법칙과 경계 조건이 주어짐) | 매우 높음 (대규모의 고품질 훈련 데이터 필요) |
| 유연성/일반화 | 낮음 (새로운 문제에 대해 재설계 및 재해석 필요) | 높음 (새로운 데이터나 조건에 적응 가능) |
| 주요 사례 | Ansys, Abaqus, COMSOL | GraphCast, AlphaFold, MatterGen |
출처: 6 기반 재구성
전통적인 수치예보모델(Numerical Weather Prediction, NWP)은 대기와 해양의 움직임을 설명하는 복잡한 물리 방정식을 슈퍼컴퓨터를 이용해 푸는 방식이다.32 ECMWF의 IFS와 같은 최첨단 NWP 모델은 높은 정확도를 자랑하지만, 한 번 예측을 생산하는 데 막대한 계산 자원과 시간이 소요되어 예보 생산 빈도와 속도에 본질적인 제약이 있었다.26
AI 기반 기상 예측 모델은 이러한 패러다임을 바꾸고 있다. 한번 훈련된 AI 모델은 추론(inference) 단계에서 매우 빠른 속도로 예측을 생성한다. Google DeepMind의 GraphCast는 단 1분 이내에 10일치 전 지구 예보를 생산할 수 있으며, 이때 드는 비용은 기존 모델의 극히 일부(약 10원 수준)에 불과한 것으로 알려졌다.26 이러한 속도 혁명은 개발 주기를 단축하고, 앙상블 예보와 같이 다양한 시나리오를 테스트하는 것을 훨씬 용이하게 만든다.6
정확도 측면에서도 AI 모델은 괄목할 만한 성과를 보였다. GraphCast는 1,380개의 검증 변수 중 90% 이상에서 기존 최고 성능의 NWP 모델인 IFS HRES보다 낮은 평균제곱근오차(RMSE)를 기록하며 더 높은 정확도를 입증했다.32 Huawei의 Pangu-Weather 역시 여러 변수에서 IFS를 능가하는 성능을 보였으며 26, 최근 동아시아 지역을 대상으로 한 비교 연구에서는 FengWu, FuXi, GraphCast 등 다수의 AI 모델이 IFS와 대등하거나 우수한 성능을 나타냈다.34
특히 AI 모델은 태풍 경로 예측과 같은 극한 기상 현상 예측에서도 강력한 성능을 보였다. 한 연구에서는 GraphCast의 7일 예측 평균 경로 오차가 201km로 IFS보다 우수했으며 57, 다른 연구에서는 FengWu 모델이 가장 정확한 경로 예측을, Pangu-Weather는 특정 유형의 태풍에서 최고의 성능을 보였다.34
하지만 AI 모델에도 명백한 한계가 존재한다. 현재 모델들은 강수량과 같은 국지적이고 미세한 현상이나, 태풍의 ‘강도(intensity)’ 예측에서는 여전히 NWP보다 취약한 모습을 보인다.34 더 큰 문제는 AI 모델이 훈련 데이터에서 보지 못한 전례 없는(record-shattering) 극한 기상 현상에 대한 외삽(extrapolation) 능력이 검증되지 않았다는 점이다.61 모델의 내부 작동 원리를 알 수 없는 ‘블랙박스’ 문제와 결합되어, 예측의 신뢰성에 대한 근본적인 의문을 남긴다.58 그럼에도 불구하고, AI 모델의 빠른 예측 속도와 높은 전반적 정확도는 이미 그 가치를 인정받아, 대한민국 기상청을 포함한 여러 기관에서 기존 수치예보모델을 보완하는 참고 자료로 활발히 활용되고 있다.32
재료 과학과 신약 개발 분야는 전통적으로 막대한 시간과 비용이 소요되는 시행착오의 영역이었다. 그러나 AI, 특히 생성형 AI의 등장은 연구 패러다임을 근본적으로 바꾸고 있다. 기존의 연구가 특정 분자나 결정 구조의 물성을 시뮬레이션하는 ‘순방향(forward)’ 접근이었다면, AI는 원하는 물성(e.g., 높은 전도성, 특정 단백질과의 결합력)을 입력했을 때 그에 맞는 새로운 구조를 생성하는 ‘역설계(inverse design)’를 가능하게 한다.7
이러한 패러다임 전환을 이끄는 실제 사례들이 속속 등장하고 있다.
이러한 혁신의 중심에는 분자 구조를 효과적으로 표현하고 학습하는 기술이 있다. Microsoft가 개발한 Graphormer는 트랜스포머 아키텍처를 그래프 데이터에 적용한 대표적인 모델이다.49 Graphormer는 분자를 원자(노드)와 결합(엣지)으로 구성된 그래프로 간주하고, 어텐션 메커니즘을 통해 원자 간의 3차원적 거리와 관계를 정교하게 인코딩한다. 이 아키텍처는 신약 개발 분야에서 약물-표적 상호작용(Drug-Target Interaction, DTI) 예측 성능을 크게 향상시켰으며 50, 대규모 분자 데이터셋 벤치마크인 PCQM4M 및 Open Catalyst Challenge에서 1위를 차지하며 그 우수성을 입증했다.66 CardiGraphormer와 같은 후속 연구들은 Graphormer를 기반으로 신약 발견 프로세스 전체를 혁신하려는 시도를 이어가고 있다.67
로봇이나 자율주행차와 같은 물리적 AI는 현실 세계의 예측 불가능한 변수와 안전 문제 때문에 모든 시나리오를 실제 환경에서 테스트하고 훈련하는 것이 거의 불가능하다.6 따라서 가상 환경에서의 시뮬레이션은 AI 모델을 안전하고 효율적으로 개발하기 위한 필수적인 요소이다. 시뮬레이션 환경은 위험한 상황(e.g., 교통사고, 악천후)을 안전하게 재현하고, 다양한 시나리오에 대한 풍부한 학습 데이터를 자동으로 생성하며, 개발 주기를 획기적으로 단축시키는 장점을 제공한다.5
이러한 시뮬레이션의 정확도와 현실성을 극대화하는 기술이 바로 ‘디지털 트윈(Digital Twin)’이다. 디지털 트윈은 물리적 객체나 시스템의 가상 복제본을 만들고, 실제 세계에서 수집된 데이터를 실시간으로 반영하여 가상 모델의 상태를 동기화한다.5 물리 AI는 이처럼 현실과 정밀하게 동기화된 디지털 트윈 환경에서 훈련됨으로써, 실제 환경에 적용되었을 때의 성능과 신뢰성을 크게 높일 수 있다.5
이 분야에서 NVIDIA는 가장 강력한 생태계를 구축하고 있다.
거대 물리 인공지능 모델이 과학적 발견의 속도와 규모를 혁신하고 있음에도 불구하고, 그 성공의 이면에는 아직 해결되지 않은 근본적인 한계와 도전 과제들이 존재한다. 모델의 높은 예측 정확도가 과연 물리적 원리에 대한 진정한 ‘이해’에서 비롯된 것인지, 아니면 정교한 ‘모방’에 불과한지에 대한 비판적 질문은 이 분야가 앞으로 나아가야 할 방향을 제시한다. 컨텍스트 패러팅, 바로가기 학습, 설명가능성 부재, 그리고 다중 스케일 모델링의 복잡성은 모두 이 핵심 질문과 맞닿아 있다.
컨텍스트 패러팅 (Context Parroting)
최근 시계열 예측을 위한 파운데이션 모델 연구에서 충격적인 현상이 발견되었다. Chronos와 같은 모델이 복잡한 동역학계를 예측할 때, 시스템의 물리적 원리를 학습하는 대신, 주어진 입력 데이터(컨텍스트) 내에서 현재 상태와 유사한 과거 패턴을 찾아 그 뒤를 그대로 ‘복사-붙여넣기’하는 단순한 전략을 사용한다는 것이다.69
놀랍게도, 훈련 가능한 파라미터가 전혀 없는 이 ‘앵무새 따라하기(context parroting)’ 방식은 수많은 파라미터를 가진 최첨단 파운데이션 모델보다 더 높은 예측 정확도를 보이는 경우가 많았다.69 이는 모델의 높은 성능 점수가 반드시 물리적 현상에 대한 깊은 이해를 담보하지 않는다는 강력한 증거다. 이 현상은 LLM에서 발견되는 ‘인덕션 헤드(induction head)’ 메커니즘, 즉 반복되는 토큰 패턴을 복사하는 능력과 유사하며, 현재의 AI 모델이 진정한 의미의 추론보다는 정교한 패턴 매칭에 크게 의존하고 있을 가능성을 시사한다.69
바로가기 학습 (Shortcut Learning)
컨텍스트 패러팅은 더 넓은 개념인 ‘바로가기 학습(shortcut learning)’의 한 형태로 볼 수 있다. 바로가기 학습이란, 모델이 문제의 본질적인 인과관계를 학습하는 대신, 훈련 데이터에만 우연히 존재하는 피상적인 상관관계(spurious correlation)를 학습하여 정답을 맞추는 현상을 말한다.73
예를 들어, 의료 초음파 영상에서 종양의 특징을 배우는 대신, 의사가 표시해 둔 캘리퍼나 텍스트 같은 인공물(artifact)을 보고 종양 유무를 판단하는 것이 바로가기 학습의 예다.73 또 다른 예로, 훈련 데이터가 항상 이미지 중앙에 대상을 위치시키는 방식으로 전처리(e.g., 제로 패딩 후 중앙 크롭)되었다면, 모델은 이미지의 중앙 영역에만 집중하는 ‘바로가기’를 학습할 수 있다.73
이러한 바로가기에 의존하는 모델은 훈련 데이터에서는 매우 높은 성능을 보이지만, 실제 테스트 환경이나 데이터 분포가 다른(out-of-distribution) 상황에서는 예측하지 못한 오류를 일으키며 일반화에 실패한다.73 이를 완화하기 위해 데이터 증강, 자기 보정(self-calibration) 전략, 어텐션 메커니즘 조절 등 다양한 기법이 제안되고 있지만, 근본적인 해결책을 찾는 것은 여전히 중요한 연구 과제로 남아있다.75
블랙박스 문제
딥러닝 모델은 수백만, 수십억 개의 파라미터가 복잡하게 상호작용하여 결과를 도출하기 때문에, 그 내부 작동 원리를 인간이 직관적으로 이해하기 매우 어렵다. 이러한 특성 때문에 딥러닝 모델은 종종 ‘블랙박스(black box)’에 비유된다.58 예측의 정확도만큼이나 그 과정의 신뢰성과 검증이 중요한 과학적 발견 분야에서 이는 치명적인 단점으로 작용한다. 모델이 왜 특정 예측을 했는지 설명할 수 없다면, 그 결과를 신뢰하고 후속 연구의 기반으로 삼기 어렵기 때문이다.80
설명가능 AI (Explainable AI, XAI)
이러한 문제를 해결하기 위해 설명가능 AI(XAI) 기술이 연구되고 있다. XAI는 DeepLIFT와 같이 모델의 예측에 어떤 입력 특징이 중요하게 작용했는지 등을 분석하여, 모델의 의사결정 과정을 인간이 이해할 수 있는 형태로 제시하는 것을 목표로 한다.80 XAI는 모델의 투명성과 신뢰성을 높이고, 잠재적인 오류나 편향을 발견하며, 규제 표준을 충족하는 데 필수적인 기술이다.80
상관관계 vs. 인과관계
더 근본적인 문제는 현재의 AI 모델 대부분이 데이터에 나타난 변수들 간의 ‘상관관계’를 학습할 뿐, ‘무엇이 원인이고 무엇이 결과인지’에 대한 ‘인과관계’를 추론하지 못한다는 점이다.83 과학적 발견의 본질은 현상에 대한 기술을 넘어 ‘왜’ 그러한 현상이 발생하는지에 대한 인과적 설명을 찾는 데 있다. 따라서 인과적 추론 능력의 부재는 물리 AI가 진정한 과학적 파트너가 되기 위해 반드시 넘어야 할 산이다.84 최근에는 구조적 인과 모델(Structural Causal Models, SCM)이나 인과 표현 학습(Causal Representation Learning)과 같은 방법론을 통해 데이터로부터 인과 구조를 발견하고 이를 모델 학습에 통합하려는 연구가 활발히 진행되고 있다.85 이는 모델을 더 강건하고, 공정하며, 설명 가능하게 만드는 핵심 열쇠가 될 것이다.87
현실 세계의 물리 현상은 대부분 단일한 스케일에서 일어나지 않는다. 재료의 파괴 현상은 원자 단위의 미시적(micro-scale) 균열에서 시작하여 구조물 전체의 거시적(macro-scale) 파단으로 이어지며, 기후 변화는 분자 수준의 온실가스 상호작용부터 대륙 규모의 대기 순환에 이르기까지 여러 시공간 스케일이 복잡하게 얽혀 있다.92
이러한 다중 스케일(multi-scale) 및 다중 물리(multi-physics) 현상을 모델링하는 것은 전통적인 수치 시뮬레이션에서도 가장 어려운 문제 중 하나로, 각 스케일을 동시에 해석하는 데 엄청난 계산 비용이 요구된다.96 AI 모델 역시 이 문제에서 자유롭지 않다.
결론적으로, 현재 물리 AI의 눈부신 성공은 ‘모래 위에 지은 성’일 수 있다는 비판적 시각이 존재한다. 예측 정확도라는 단일 지표에만 매몰될 경우, 우리는 물리적 실체와는 무관한 정교한 ‘패턴 복사기’를 개발하는 데 그칠 위험이 있다. 따라서 미래 연구는 정확도 향상과 더불어, 모델이 진정한 물리적 추론 능력을 갖추도록 강제하는 새로운 아키텍처(e.g., 인과 모델, 뉴로-심볼릭 AI)와 이를 검증할 수 있는 새로운 평가 방법론 개발에 집중해야 한다.
물리 인공지능이 직면한 도전 과제들은 역설적으로 미래 연구의 방향성을 명확히 제시한다. 현재의 ‘대리(Surrogate)’와 ‘보조(Assistant)’ 역할을 넘어, AI가 과학적 발견의 주체적인 파트너, 즉 ‘자율적 발견자(Autonomous Discoverer)’로 진화하기 위한 경로는 하이브리드 접근법의 고도화, 진정한 파운데이션 모델의 정립, 그리고 자율적 AI 에이전트의 실현이라는 세 가지 핵심 이정표를 통해 구체화될 수 있다.
물리 AI의 단기적인 미래는 순수 AI 모델이나 전통적인 수치해석 방법 중 하나를 선택하는 것이 아니라, 두 가지를 지능적으로 결합하는 ‘하이브리드 접근법’에 있다. PINN의 학습 불안정성과 정확도 문제를 해결하기 위해, 전통적인 수치해석 프레임워크의 계산량이 많은 특정 부분(e.g., 비선형 항 계산)을 신경망으로 대체하거나, AI 모델로 전체적인 근사치를 빠르게 계산한 후 전통적인 솔버로 정밀하게 보정하는 방식의 연구가 활발히 진행되고 있다.14 이러한 하이브리드 시뮬레이션은 전통적 방법의 물리적 엄밀성과 AI의 속도 및 유연성을 결합하여 실질적인 시너지를 창출할 수 있다.51
더 나아가, 딥러닝의 데이터 기반 패턴 인식 능력(Neuro)과 기호 논리 기반의 명시적 추론 능력(Symbolic)을 결합하려는 ‘뉴로-심볼릭 AI(Neuro-Symbolic AI)’는 물리 AI의 근본적인 한계를 극복할 열쇠로 주목받고 있다.102 이 접근법은 물리 방정식, 보존 법칙, 대칭성과 같은 기호적 지식을 AI 모델의 아키텍처나 학습 과정에 직접 통합한다. 이를 통해 데이터에만 의존하는 모델이 취약한 외삽(extrapolation) 능력을 개선하고, 더 적은 데이터로도 강건하며, 예측 과정을 해석하기 쉬운 모델을 만들 수 있을 것으로 기대된다.102 이는 AI가 단순히 현상을 모방하는 것을 넘어, 그 이면의 원리를 이해하도록 만드는 중요한 단계다.
중기적으로 물리 AI 분야는 진정한 의미의 ‘과학을 위한 파운데이션 모델’을 정립하고 발전시키는 방향으로 나아가야 한다. 이를 위해서는 먼저, 모델의 일반성, 재사용성, 확장성을 정량적으로 평가할 수 있는 표준화된 벤치마크와 프레임워크를 개발하는 것이 시급하다.8
미래의 과학 파운데이션 모델은 텍스트(논문), 이미지(현미경 사진), 시계열(센서 데이터), 구조(분자 그래프) 등 다양한 형태의 과학 데이터를 통합적으로 이해하고 처리하는 멀티모달(multimodal) 능력을 갖추어야 한다.1 또한, 새로운 실험 데이터나 이론이 등장했을 때 모델 전체를 재학습하지 않고도 지식을 점진적으로 업데이트할 수 있는 지속적 학습(Continual Learning) 및 사후 학습 능력은 필수적이다.1
이러한 고도화된 모델의 개발과 함께, 모델 생성의 대중화 또한 중요한 흐름이 될 것이다. AutoML, No-code/Low-code 플랫폼, 그리고 클라우드 기반 AI 서비스의 발전은 코딩이나 AI 전문 지식이 없는 과학자들도 자신들의 연구에 맞는 물리 AI 모델을 쉽게 개발하고 활용할 수 있는 환경을 제공할 것이다.3 NVIDIA의 Modulus와 같은 프레임워크는 이러한 추세를 가속화하는 대표적인 예다.45 이는 AI를 소수 전문가의 전유물이 아닌, 모든 과학자를 위한 보편적인 연구 도구로 만드는 데 기여할 것이다.
물리 AI의 장기적인 비전은 스스로 목표를 설정하고, 환경과 상호작용하며, 자율적으로 학습하고 행동하는 ‘AI 에이전트(AI Agent)’를 통해 과학 발견의 전 과정을 자동화하는 것이다.4 이러한 AI 에이전트는 단순히 데이터 분석이나 시뮬레이션 실행과 같은 개별 작업을 수행하는 것을 넘어, 가설 생성, 실험 설계, 결과 분석 및 새로운 가설 도출에 이르는 과학 연구의 전체 순환 고리(loop)를 자율적으로 수행할 수 있다.106
미래의 연구실은 인간 과학자가 AI 에이전트와 협력하여 창의적인 아이디어를 탐색하고, AI는 디지털 트윈과 같은 고도로 현실적인 가상 환경에서 수많은 가설을 자동으로 검증하는 형태로 운영될 것이다.68 이는 제조업, 로보틱스, 신약 개발 등 다양한 산업에서 생산성을 극대화하고 전례 없는 혁신을 이끌어낼 것으로 전망된다.5 실제로 Deloitte와 같은 시장 분석 기관은 관련 로보틱스 및 자동화 시장이 2035년까지 연평균 64%라는 폭발적인 성장률을 기록할 것으로 예측하며, 특히 휴머노이드 로봇과 같은 물리적 AI의 상용화가 이 성장을 견인할 것으로 보고 있다.68
결론적으로, 물리 AI의 발전 로드맵은 점진적이지만 명확하다. ‘더 빠른 시뮬레이터’에서 시작하여, ‘더 똑똑한 연구 조수’를 거쳐, 궁극적으로는 ‘독창적인 동료 연구자’로 나아가는 과정이다. 이 진화의 경로에서 가장 중요한 변곡점은 AI가 데이터의 상관관계를 넘어 물리 세계의 인과관계를 이해하고, 이를 바탕으로 자율적으로 가설을 생성하고 검증하는 능력을 갖추는 순간이 될 것이다.
본 고찰은 거대 물리 인공지능 모델이 데이터 중심 AI의 한계를 넘어, 물리 법칙을 내재화하고 실제 세계와 상호작용함으로써 과학 및 공학 분야에서 일으키고 있는 패러다임 전환을 심층적으로 분석했다. PINN, GNN, 트랜스포머, 등변 신경망, 뉴럴 오퍼레이터 등 다양한 기술적 초석들은 물리적 제약을 모델에 효과적으로 통합하여 데이터 효율성과 일반화 성능을 높이고 있다. 이를 바탕으로 기상 예측, 재료 과학, 신약 개발, 로보틱스 등 핵심 응용 분야에서 전통적인 방법론을 압도하는 속도와 규모의 혁신이 현실화되고 있음을 확인했다. GraphCast와 Pangu-Weather는 수치예보모델의 계산 비용 한계를 돌파했으며, GNoME과 MatterGen은 신소재 발견의 속도를 수십, 수백 배 가속하고 있다.
그러나 이러한 눈부신 성과 이면에는 ‘컨텍스트 패러팅’과 ‘바로가기 학습’으로 대표되는 모델의 피상적 학습 문제, 예측 과정의 투명성을 저해하는 ‘블랙박스’ 문제와 인과적 추론 능력의 부재, 그리고 현실 세계의 복잡성을 온전히 담아내기 위한 ‘다중 스케일/다중 물리’ 모델링의 어려움 등 근본적인 도전 과제들이 상존한다. 이러한 과제들은 현재 AI 모델의 높은 예측 정확도가 진정한 ‘물리적 이해’에 기반한 것인지에 대한 중요한 질문을 던지며, 향후 연구 개발의 방향성을 제시한다.
거대 물리 인공지능 모델이 가진 잠재력을 극대화하고 당면 과제를 해결하기 위해, 연구, 산업, 정책 분야에 걸친 다각적이고 전략적인 접근이 요구된다.
| A Perspective on Foundation Models in Chemistry | JACS Au - ACS Publications, accessed July 8, 2025, https://pubs.acs.org/doi/10.1021/jacsau.4c01160 |
| AI 기반 물리 정보 신경망을 이용한 시뮬레이션 | 인사이트리포트 | 삼성 …, accessed July 8, 2025, https://www.samsungsds.com/kr/insights/physics_informed_neural_network.html |
| Learning Symbolic Physics with Graph Networks | by Kamal Acharya - Medium, accessed July 8, 2025, https://medium.com/@lotussavy/learning-symbolic-physics-with-graph-networks-265d74c9ca1c |
| Revolutionizing Weather Forecasting with Graph Neural Networks | by climatecast - Medium, accessed July 8, 2025, https://medium.com/stanford-cs224w/revolutionizing-weather-forecasting-with-graph-neural-networks-dcc2d06a4d52 |
| NVIDIA가 개발한 물리학 학습용 AI 프레임워크 | NVIDIA Blog, accessed July 8, 2025, https://blogs.nvidia.co.kr/blog/modulus-framework/ |
| AI can transform innovation in materials design – here’s how | World Economic Forum, accessed July 8, 2025, https://www.weforum.org/stories/2025/06/ai-materials-innovation-discovery-to-design/ |
| Microsoft MatterGen: AI model for material design and discovery | by Mehul Gupta - Medium, accessed July 8, 2025, https://medium.com/data-science-in-your-pocket/microsoft-mattergen-ai-model-for-material-design-and-discovery-4d1b74ba4cfe |
| Foundation models in bioinformatics | National Science Review - Oxford Academic, accessed July 8, 2025, https://academic.oup.com/nsr/article/12/4/nwaf028/7979309 |
| DrugormerDTI: Drug Graphormer for drug–target interaction prediction | Request PDF, accessed July 8, 2025, https://www.researchgate.net/publication/370205826_DrugormerDTI_Drug_Graphormer_for_drug-target_interaction_prediction |
| Hung-Chi Kuo’s research works | National Taiwan University and other places, accessed July 8, 2025, https://www.researchgate.net/scientific-contributions/Hung-Chi-Kuo-2037103498 |
| Foundation Models for Materials Discovery: Our Investment in Orbital Materials | by Toyota Ventures - Medium, accessed July 8, 2025, https://medium.com/toyota-ventures/foundation-models-for-materials-discovery-our-investment-in-orbital-materials-ce5d93847f61 |
| Inverse Uncertainty Quantification using the Modular Bayesian Approach based on Gaussian Process, Part 2: Application to TRACE | Request PDF - ResearchGate, accessed July 8, 2025, https://www.researchgate.net/publication/386716732_Inverse_Uncertainty_Quantification_using_the_Modular_Bayesian_Approach_based_on_Gaussian_Process_Part_2_Application_to_TRACE |
| Neurosymbolic AI as an antithesis to scaling laws | PNAS Nexus - Oxford Academic, accessed July 8, 2025, https://academic.oup.com/pnasnexus/article/doi/10.1093/pnasnexus/pgaf117/8134151 |
| INFER: A Neural-symbolic Model For Extrapolation Reasoning on Temporal Knowledge Graph | OpenReview, accessed July 8, 2025, https://openreview.net/forum?id=ExHUtB2vnz |