년 5월 AI 및 로봇 연구 동향
1. 서론: 2020년 5월, AI 및 로봇 공학의 변곡점
2020년 5월은 전 세계가 COVID-19 팬데믹이라는 전례 없는 위기에 직면한 시점이었다. 물리적 세계의 단절과 사회적 거리두기는 역설적으로 인공지능(AI) 및 로봇 기술의 연구 개발과 사회적 수용을 가속하는 강력한 촉매로 작용했다.1 이러한 특수한 시대적 배경 속에서, 해당 월에 발표된 일련의 연구 성과들은 기술 발전의 중요한 변곡점을 형성했다.
IEEE 국제 로봇 자동화 학회(ICRA)와 국제 표현 학습 학회(ICLR)와 같은 세계 최고 수준의 학술대회들이 사상 최초로 완전한 가상(virtual) 형태로 개최되었다.3 이는 지식 전파 방식의 근본적인 변화를 예고했으며, 전 세계 연구자들이 물리적 제약 없이 최신 연구 성과에 접근할 수 있는 새로운 패러다임을 열었다. 이러한 변화의 중심에서 로봇 공학과 AI 분야는 괄목할 만한 진전을 이루었다.
본 보고서는 2020년 5월에 발표된 네 가지 핵심 이정표—ICRA & ICLR 2020의 학술적 성과, OpenAI GPT-3의 등장, MIT-IBM Watson AI Lab의 COVID-19 대응 프로젝트, 그리고 구글의 코어 알고리즘 업데이트—를 중심으로 심층 분석을 진행한다. 각 사건들은 개별적인 성과를 넘어 서로 유기적으로 연결되어 있으며, 이들이 어떻게 상호작용하며 AI 기술의 새로운 지평을 열었는지, 그리고 그 기술적, 사회적 유산이 무엇인지 다각적으로 조망하는 것을 목표로 한다.
2. 주요 학술대회 동향 분석: ICRA & ICLR 2020
2.1 ICRA 2020: 위기 속에서 지속된 로봇 공학의 혁신
IEEE 로봇 자동화 학회(Robotics and Automation Society)의 플래그십 컨퍼런스인 ICRA 2020은 본래 프랑스 파리에서 개최될 예정이었으나, 팬데믹의 영향으로 5월 31일부터 8월 31일까지 장기간에 걸친 가상 컨퍼런스로 전환되었다.3 이러한 형식적 변화에도 불구하고, 1,600편 이상의 최첨단 논문이 발표되었으며, Slack, IEEE.TV 등 다양한 온라인 플랫폼을 활용한 새로운 방식의 학술적 소통이 시도되었다.6
발표된 논문들의 핵심 키워드를 분석한 결과, ‘심층 학습(Deep Learning in Robotics and Automation)’, ‘모션 및 경로 계획(Motion and Path Planning)’, ‘SLAM’, ‘자율주행차 내비게이션(Autonomous Vehicle Navigation)’, ‘다중 로봇 시스템(Multi-Robot Systems)’ 등이 가장 높은 빈도를 보였다.8 이는 인공지능 기술, 특히 딥러닝이 로봇 공학의 거의 모든 하위 분야에 깊숙이 통합되어 핵심적인 역할을 수행하고 있음을 명확히 보여준다.
주목할 만한 연구 분야는 다음과 같다.
-
SLAM 및 위치 추정(Localization): 다양한 환경에서 로봇의 정밀한 위치 추정 및 지도 작성을 위한 연구들이 다수 발표되었다. ’Metrically-Scaled Monocular SLAM’은 단일 카메라를 사용하면서도 실제 거리 단위를 추정하는 방법을 제안했으며, ’Visual-Inertial SLAM’은 카메라와 관성 측정 장치(IMU)를 결합하여 강건성을 높이는 연구의 계보를 이었다.8 이는 자율주행 및 드론 기술의 핵심 기반 기술로서 그 중요성이 지속적으로 강조되었다.
-
자율 비행 드론 및 항공 로봇: 항공 로봇의 능력 확장을 위한 연구들이 주목받았다. 천장 근접 비행 시 발생하는 공기역학적 효과인 ’천장 효과(Ceiling Effect)’를 모델링하여 안정적인 비행 제어를 구현한 연구나, 미지의 환경을 신속하게 탐색하기 위한 ‘모션 프리미티브 기반 경로 계획(Motion Primitives-based Path Planning)’ 연구 등이 발표되었다.9 또한, 공중에서 물체를 다시 파지하는 ‘Aerial Regrasping’ 기술은 항공 로봇의 조작 능력을 한 단계 끌어올렸다.9
-
강화학습 및 제어: 데이터 기반의 지능형 제어 방식의 발전이 두드러졌다. 심층 강화학습을 이용해 복잡한 교통 상황에서의 차량 합류 제어기를 개발한 연구나, 모델 예측 제어(Model Predictive Control, MPC)의 성능을 높이기 위해 모델의 부정확성으로 인해 발생하는 비용 오차를 온라인 학습을 통해 보정하는 기법 등이 제시되었다.7 이는 전통적인 모델 기반 제어의 한계를 극복하려는 시도로 해석된다.
2.2 ICRA 2020 최우수 논문 심층 분석: “외골격 보행 최적화를 위한 선호도 기반 학습”
ICRA 2020에서 가장 큰 주목을 받은 연구는 캘리포니아 공과대학교(Caltech) 연구팀(Maegan Tucker, Ellen Novoseller, Claudia Kann, Yanan Sui, Yisong Yue, Joel Burdick, Aaron Ames)의 논문 “Preference-Based Learning for Exoskeleton Gait Optimization“이었다. 이 연구는 ’최우수 컨퍼런스 논문상(Best Conference Paper Award)’과 ’최우수 인간-로봇 상호작용 논문상(Best Paper Award on Human-Robot Interaction)’을 동시에 수상하는 영예를 안았다.10
연구 목표
이 연구의 핵심 목표는 사용자의 주관적인 ‘선호도(preference)’ 피드백을 기반으로 외골격 로봇의 보행 패턴을 개인에게 최적화하는 것이다. 기존의 최적화 방식은 에너지 소모량이나 보행 속도와 같은 정량적이고 객관적인 지표에 의존했다. 하지만 이러한 지표만으로는 사용자가 실제로 느끼는 편안함, 안정감, 자연스러움 등 정성적인 만족도를 극대화하기 어려웠다. 이 연구는 이러한 한계를 극복하고자 했다.
핵심 방법론: 선호도 기반 베이즈 최적화 (Preference-Based Bayesian Optimization)
본 연구의 방법론은 인간-로봇 상호작용(HRI)에 베이즈 최적화 기법을 창의적으로 적용한 점이 특징이다.
-
이진 선호도 피드백(Binary Preference Feedback): 알고리즘은 사용자에게 두 가지 서로 다른 외골격 보행 파라미터 조합으로 생성된 보행 패턴을 체험하게 한 후, 어느 쪽을 더 선호하는지에 대한 이진(binary) 응답만을 수집한다.13 이는 인간이 절대적인 수치 점수를 매기는 것보다 두 대상을 상대적으로 비교하는 것에 더 능숙하고 일관적이라는 심리학적 통찰에 기반한다.15
-
잠재 효용 함수 모델링(Latent Utility Function Modeling): 연구진은 각 보행 파라미터 조합 x에 대해 사용자가 느끼는 만족도를 나타내는 미지의 잠재 효용 함수 f(x)가 존재한다고 가정한다. 이 함수는 직접 관찰할 수 없지만, 선호도 피드백을 통해 추정할 수 있다. 이 함수를 모델링하기 위해 비모수적 베이즈 기법인 가우시안 프로세스(Gaussian Process, GP)를 사용했다.13 GP는 적은 수의 데이터로도 함수 전체에 대한 불확실성을 포함한 확률적 예측을 가능하게 하여 데이터 수집 비용이 높은 인간 대상 실험에 매우 효과적이다.
-
확률적 선호도 모델: 사용자가 파라미터 xa를 xb보다 선호할 확률 P(x_a \succ x_b)는 두 파라미터의 잠재 효용 값의 차이 f(x_a) - f(x_b)에 비례한다고 가정한다. 이는 일반적으로 로지스틱 함수 σ를 통해 다음과 같이 모델링된다.
P(x_a \succ x_b) = \sigma(f(x_a) - f(x_b))
수집된 이진 선호도 데이터셋을 기반으로 GP의 사후 확률(posterior probability)을 업데이트함으로써, 알고리즘은 점차 사용자의 선호도 지형(preference landscape)을 학습해 나간다. 이후, 학습된 모델을 기반으로 가장 유용할 것으로 기대되는 새로운 파라미터 조합을 사용자에게 제시하는 과정을 반복하여 최적점을 탐색한다.
기술적 의의 및 영향
이 연구는 인간-로봇 상호작용 분야에서 ‘인간 중심(human-in-the-loop)’ 최적화의 새로운 지평을 열었다. 로봇이 단순히 사전에 정의된 임무를 수행하는 수동적인 도구를 넘어, 사용자와의 지속적인 상호작용을 통해 개인의 주관적이고 암묵적인 요구에 맞춰 스스로의 행동을 ’진화’시키는 새로운 패러다임을 구체적으로 구현했다. 과거 로봇 연구가 기구학, 동역학 등 모델 기반 접근법에 치중했다면, 이 연구는 AI의 학습 능력을 인간의 주관성과 결합하여 기존의 정량적 최적화로는 해결할 수 없었던 ‘개인화’ 문제를 해결했다. 이는 AI의 발전이 로봇의 ’지능’을 향상시키는 것을 넘어, 로봇의 설계 철학 자체를 ’정해진 임무 수행’에서 ’인간과의 상호작용을 통한 적응 및 진화’로 전환시키고 있음을 의미한다. 이러한 접근법은 재활 로봇, 보조 기기, 맞춤형 서비스 로봇 등 개인화가 필수적인 다양한 응용 분야에 큰 영향을 미칠 것으로 기대된다.16
2.3 ICLR 2020: 표현 학습의 최전선과 거대 모델의 서막
표현 학습(Representation Learning) 분야의 최고 권위 학회인 ICLR 2020 역시 4월 26일부터 가상으로 개최되었다.18 팬데믹이라는 특수한 상황으로 인해, 조직위원회는 이례적으로 ’최우수 논문상’을 시상하지 않기로 결정했으나, 발표된 논문들은 AI 분야의 기술적 흐름을 선도하는 중요한 이정표가 되었다.5
핵심 트렌드
ICLR 2020에서 나타난 주요 연구 흐름은 다음과 같이 요약할 수 있다.
-
언어 모델의 효율화 및 경량화: 거대 언어 모델의 성능은 인정하지만, 그 막대한 계산 비용과 메모리 요구사항에 대한 문제의식이 확산되었다. 구글의 ’ALBERT: A Lite BERT’는 파라미터 공유 등의 기법을 통해 BERT의 크기를 대폭 줄이면서도 성능 저하를 최소화했다.20 ’Reformer: The Efficient Transformer’는 어텐션 메커니즘을 지역 민감 해싱(Locality-Sensitive Hashing)으로 근사하고, 가역 잔차 네트워크(Reversible Residual Networks)를 도입하여 메모리 사용량을 획기적으로 개선했다.20 이러한 연구들은 거대 모델의 현실적인 배포와 접근성 문제를 해결하려는 중요한 흐름을 형성했다.
-
자기 지도 학습(Self-supervised Learning)의 약진: 레이블이 없는 대규모 데이터로부터 모델 스스로 유용한 표현(representation)을 학습하는 자기 지도 학습이 언어 모델을 넘어 다양한 분야로 확산되었다. ’ELECTRA’는 기존의 마스크된 언어 모델(Masked Language Model) 방식 대신, 생성자(generator)가 만들어낸 가짜 토큰을 판별자(discriminator)가 구별하도록 학습시키는 새로운 사전학습 방식을 제안하여 훈련 효율을 크게 높였다.21
-
신경망 아키텍처 탐색(Neural Architecture Search, NAS)의 성숙: 최적의 신경망 구조를 자동으로 탐색하는 NAS 분야는 초기 탐색 단계를 지나 방법론의 신뢰성과 재현성을 높이는 방향으로 발전했다. ’NAS-Bench-102’는 표준화된 탐색 공간과 벤치마크를 제공하여 다양한 NAS 알고리즘을 공정하게 비교할 수 있는 기반을 마련했다.5 ’Understanding and Robustifying Differentiable Architecture Search’는 널리 사용되는 미분 가능 NAS 기법의 한계를 심도 있게 분석하고 안정성을 높이는 방안을 제시했다.5
이러한 ICLR 2020의 ’효율성’에 대한 깊은 고민은, 이미 학계와 산업계가 거대 모델의 엄청난 연산 비용과 그에 따른 환경적 영향에 대한 문제의식을 공유하고 있었음을 방증한다.22 2018년 BERT의 등장 이후 모델의 크기를 키우는 것이 성능 향상의 지름길이라는 인식이 퍼졌지만, ICLR 2020에서는 이러한 흐름에 대한 반작용 또는 보완책으로서 모델을 더 ‘가볍고 빠르게’ 만드는 연구가 큰 주목을 받았다. 이는 기술의 지속 가능성과 실용성을 고민하는 성숙 단계로의 진입을 의미한다. 흥미롭게도, 이러한 ’효율성’에 대한 논의가 무르익던 바로 그 시점에, OpenAI는 정반대로 ’규모’를 극한까지 밀어붙인 GPT-3를 발표했다. 따라서 2020년 5월은 AI 연구의 두 가지 핵심 방향성, 즉 ’규모의 한계 돌파’와 ’효율적 자원 활용’이라는 상반되면서도 상호보완적인 두 축이 본격적으로 경쟁하고 상호작용하기 시작한 기점으로 해석할 수 있다.
3. 거대 언어 모델의 등장과 패러다임 전환: OpenAI GPT-3
3.1 논문 심층 분석: “Language Models are Few-Shot Learners”
2020년 5월 28일, 오픈소스 preprint 서버인 arXiv에 공개된 OpenAI의 논문 “Language Models are Few-Shot Learners“는 인공지능 연구의 역사를 바꾼 기념비적인 성과로 평가받는다.23 이 논문은 이후 NeurIPS 2020 학회에서 최우수 논문상을 수상하며 그 학술적 가치를 공인받았다.11
핵심 주장
논문의 핵심 주장은 기존 자연어 처리(NLP) 분야의 지배적인 패러다임이었던 ’사전학습 후 미세조정(pre-training and fine-tuning)’을 넘어설 수 있다는 가능성을 제시한 것이다. 즉, 언어 모델의 규모를 전례 없는 수준으로 극단적으로 확장하면, 특정 과업을 위한 별도의 데이터셋으로 모델 가중치를 업데이트하는 미세조정 과정 없이도, 모델에 입력되는 문맥(context) 안에 주어진 몇 개의 예시나 자연어 지시사항만으로 새로운 과업을 준수하게 수행할 수 있다는 것을 실험적으로 입증했다.23
모델 아키텍처 및 규모
GPT-3는 1,750억 개의 매개변수(parameter)를 가진 자기회귀(autoregressive) 트랜스포머(Transformer) 모델이다.23 이는 당시 공개된 가장 큰 언어 모델이었던 마이크로소프트의 Turing NLG(170억 개)보다 10배 이상, 그리고 이전 모델인 GPT-2(15억 개)보다는 100배 이상 큰 규모였다.24 이러한 엄청난 규모의 증가는 AI 모델 훈련에 필요한 컴퓨팅 자원이 기하급수적으로 증가하는 추세를 단적으로 보여주었으며, AI 연구의 패러다임을 바꾸는 물리적 기반이 되었다.26
훈련 데이터
모델은 방대한 양의 텍스트 데이터로 사전학습되었다. 주요 데이터 소스로는 인터넷 전반의 데이터를 수집한 Common Crawl, 고품질 웹 텍스트 모음인 WebText2, 그리고 두 개의 대규모 디지털 도서 코퍼스(Books1, Books2) 및 Wikipedia가 포함되었다.23 전체적으로 약 45TB에 달하는 원시 텍스트 데이터를 필터링하고 가중치를 부여하여 약 570GB 크기의 고품질 훈련 데이터셋을 구축했다.
3.2 인컨텍스트 학습(In-Context Learning)의 개념과 기술적 의의
GPT-3가 제시한 가장 혁신적인 개념은 ’인컨텍스트 학습(In-Context Learning)’이다.
정의
인컨텍스트 학습은 모델의 가중치(weights)를 변경하는 어떠한 기울기 업데이트(gradient update) 과정도 없이, 추론(inference) 시점에 모델의 입력값, 즉 프롬프트(prompt)에 과업에 대한 자연어 설명과 몇 가지 예시(demonstrations)를 함께 제공하여 모델이 해당 과업의 패턴을 파악하고 수행하도록 유도하는 방식이다.23
학습 방식 비교
논문에서는 인컨텍스트 학습을 세 가지 조건으로 나누어 평가했다.
-
제로샷(Zero-shot) 학습: 과업에 대한 자연어 설명만 제공하고, 어떠한 예시도 주지 않는다.
-
원샷(One-shot) 학습: 과업 설명과 함께 단 하나의 예시를 제공한다.
-
퓨샷(Few-shot) 학습: 과업 설명과 함께 모델의 문맥 창(context window)이 허용하는 한 여러 개의 예시(통상 10~100개)를 제공한다.
기술적 의의
인컨텍스트 학습의 등장은 AI 모델을 활용하는 방식에 근본적인 변화를 가져왔다. 이전까지는 새로운 과업을 수행하기 위해 해당 과업에 특화된 수천, 수만 개의 레이블링된 데이터셋을 구축하고, 사전학습된 모델을 이 데이터로 다시 훈련(미세조정)하는 과정이 필수적이었다. 그러나 GPT-3는 이러한 과정을 생략하고, 마치 사람에게 설명하듯 자연어 프롬프트를 작성하는 것만으로 다양한 작업을 즉석에서 수행할 수 있음을 보여주었다. 이는 AI의 ’범용성(generality)’과 ’접근성’을 전례 없는 수준으로 향상시킨 패러다임 전환이었다.16
기존의 미세조정이 특정 과업에 대한 ’지식’을 모델의 가중치에 직접 ’주입’하는 방식이었다면, 인컨텍스트 학습은 이미 방대한 지식을 내재한 모델의 가중치는 그대로 둔 채, 입력 프롬프트를 통해 모델의 ’주의(attention)’를 특정 방향으로 유도하여 내재된 능력을 ’활성화’시키는 방식에 가깝다. 이는 마치 인간이 새로운 문제를 접했을 때, 기존에 축적된 지식을 바탕으로 문제의 예시 몇 개를 보고 해결 방법을 유추하는 인지 과정과 유사하다. 따라서 GPT-3는 AI의 ’학습’이 더 이상 가중치 업데이트만을 의미하는 것이 아니라, 추론 시점의 동적인 문맥 이해를 포함하는 더 넓은 개념으로 확장될 수 있음을 보여준 첫 사례로 평가된다.
3.3 모델 규모 확장(Scaling Law)의 영향과 미래 전망
GPT-3의 성공은 AI 연구 커뮤니티에 “모델의 성능은 세 가지 핵심 요소—모델의 매개변수 수, 훈련 데이터셋의 크기, 그리고 훈련에 사용된 컴퓨팅 총량—에 따라 예측 가능한 로그-선형적(log-linear) 방식으로 향상된다“는 ‘스케일링 법칙(Scaling Law)’ 가설을 강력하게 뒷받침했다.
영향
이 발견은 이후 AI 연구 개발의 방향을 ’더 크고 더 많은 데이터로 훈련된 모델’을 만드는 경쟁으로 이끌었다. 구글, 메타, 마이크로소프트 등 빅테크 기업들은 수천억에서 조 단위 파라미터를 가진 초거대 모델 개발에 막대한 자본과 컴퓨팅 인프라를 투자하기 시작했다.27 GPT-3 훈련에 필요한 막대한 컴퓨팅 자원은 개인 연구자나 대학 연구실 수준에서는 감당할 수 없는 규모였고 26, 이는 최첨단 AI 모델 개발의 주도권이 소수의 빅테크 기업으로 완전히 넘어가는 결정적 계기가 되었다.24 결과적으로 AI 연구 생태계는 거대 모델을 직접 개발하는 소수와, 이들이 API 형태로 제공하는 모델을 활용하여 응용 연구를 수행하는 다수로 양분되는 구조가 형성되었다.28
한계와 과제
논문 저자들 스스로도 GPT-3의 명백한 한계와 잠재적 위험성을 지적했다. 모델은 특정 유형의 추론, 특히 두 대상을 비교하거나 대조하는 작업에서 약점을 보였다.23 또한, 훈련 데이터에 내재된 사회적 편향(bias)을 그대로 학습하고 때로는 증폭시켜 유해하거나 불공정한 결과물을 생성할 위험이 크다는 점도 중요한 문제로 제기되었다.30 모델의 내부 작동 방식을 이해하고 설명하기 어렵다는 ‘블랙박스’ 문제와, 모델 훈련에 소요되는 막대한 에너지 사용량 역시 AI 기술이 지속 가능하기 위해 해결해야 할 중요한 미래 과제로 남았다.23
4. 팬데믹 대응을 위한 AI 기술 활용
4.1 MIT-IBM Watson AI Lab의 COVID-19 대응 10대 연구 프로젝트 개요
2020년 5월 19일, MIT-IBM Watson AI Lab은 COVID-19 팬데믹이 초래한 전 지구적 보건 및 경제 위기 해결을 목표로 하는 10개의 AI 기반 연구 프로젝트에 자금을 지원한다고 발표했다.22 이 이니셔티브는 AI와 데이터 과학 기술을 활용하여 바이러스의 근본적인 이해, 효과적인 치료법 개발, 합리적인 공중 보건 정책 수립, 그리고 경제적 충격 완화 등 다방면에 걸쳐 실질적인 해결책을 모색하는 것을 목표로 했다. 이는 AI 기술이 가진 사회적 책임과 역할을 보여주는 상징적인 사례로 평가된다.34
10개의 프로젝트는 분자생물학에서부터 임상의학, 공중보건, 경제학에 이르기까지 매우 넓은 범위를 포괄하며, 각 프로젝트의 목표와 방법론을 일목요연하게 정리하면 다음과 같다.
| 프로젝트 번호 | 프로젝트 명 | 주요 연구 목표 | AI/데이터 과학 방법론 |
|---|---|---|---|
| 1 | COVID-19 환자의 패혈증 조기 발견 | 환자 백혈구 이미지 분석을 통한 패혈증 발병 위험 예측 | 머신러닝 기반 이미지 분석 |
| 2 | SARS-CoV-2 차단을 위한 단백질 설계 | 바이러스가 인간 세포에 결합하는 것을 막는 새로운 단백질 구조 설계 | AI 기반 단백질 폴딩(Protein Folding) 예측 및 시뮬레이션 |
| 3 | 경제 재개를 위한 생명 구조 모델링 | 표적화된 봉쇄 정책의 경제 및 공중 보건 효과 모델링 | 경제 모델링, 감염병 확산 시뮬레이션 |
| 4 | 최적의 안면 마스크 재료 탐색 | 다양한 마스크 재료의 비말 차단 효과 정량적 측정 및 평가 | 유체 역학 분석, 데이터 기반 성능 평가 |
| 5 | 기존 약물을 이용한 COVID-19 치료 (신약 재창출) | 기존 승인 약물 중 COVID-19에 효과적인 후보 물질 스크리닝 | 3D 분자 구조 표현 학습, 슈퍼컴퓨터를 활용한 고속 스크리닝 |
| 6 | 프라이버시를 보호하는 자동 접촉자 추적 | 암호화된 블루투스 데이터를 활용한 익명 기반 접촉자 추적 시스템 개발 | 암호학, 보안 데이터 분석 |
| 7 | 백신 대량 생산 및 공급망 최적화 | 백신 후보 물질의 글로벌 생산 및 공평한 분배를 위한 전략 수립 | 통계 모델링, 공급망 최적화 시뮬레이션 |
| 8 | 전자의무기록(EMR)을 활용한 치료법 탐색 | 수백만 명의 EMR 데이터를 분석하여 잠재적 치료 약물 신호 발견 | 통계 분석, 머신러닝, 시뮬레이션 기반 임상 시험 |
| 9 | 인공호흡기 치료 최적화 | 환자 데이터 기반 최적의 인공호흡기 설정 및 사용 기간 예측 | 시계열 데이터 분석, 강화학습 기반 의사결정 지원 시스템 |
| 10 | 맞춤형 방역 및 대규모 검사 전략 수립 | 표적 봉쇄, 개인 맞춤형 치료, 신속 대량 검사법 개발 | 머신러닝 기반 환자 위험도 예측, 분광학 기반 신속 진단법 개발 |
4.2 주요 프로젝트 상세 분석
이들 프로젝트 중 특히 AI 기술의 잠재력을 잘 보여주는 몇 가지 사례를 심층적으로 분석하면 다음과 같다.
-
신약 재창출 (프로젝트 5 & 8): 신약 개발에는 막대한 시간과 비용이 소요되므로, 팬데믹과 같은 긴급 상황에서는 이미 안전성이 검증된 기존 약물 중에서 새로운 치료 효과를 보이는 약물을 찾아내는 ‘신약 재창출(Drug Repurposing)’ 전략이 매우 중요하다. Rafael Gomez-Bombarelli 교수팀(프로젝트 5)은 분자의 2차원 구조 정보만으로는 약물과 표적 단백질 간의 상호작용을 정확히 예측하기 어렵다는 점에 착안, 분자의 3차원 공간 구조 정보를 학습하는 AI 모델을 개발하고자 했다. 이를 통해 약물 효능 예측의 정확도를 높이고, NASA와 미국 에너지부(DOE)의 슈퍼컴퓨터를 활용하여 수많은 후보 약물에 대한 스크리닝 속도를 획기적으로 높이는 것을 목표로 했다.32 한편, Roy Welsch 교수팀(프로젝트 8)은 수백만 명의 익명화된 전자의무기록(EMR)과 의료 청구 데이터를 분석하여, 특정 약물을 복용하는 환자군에서 COVID-19 중증도가 낮아지는 등의 통계적 신호를 머신러닝으로 포착하고자 했다.33 이러한 접근법은 AI가 신약 개발의 시간과 비용을 단축할 뿐만 아니라, 실제 임상 데이터(Real-World Data)에 기반한 새로운 가설을 생성할 수 있는 가능성을 보여준다. 실제로 이와 유사한 후속 연구에서 AI는 노화와 SARS-CoV-2 감염 경로의 교차점을 분석하여 RIPK1 단백질을 유망한 치료 표적으로 식별하고, 관련 항암제를 치료 후보로 제안하는 성과를 거두기도 했다.35
-
단백질 설계 (프로젝트 2): 이 프로젝트는 AI의 역할을 한 단계 더 발전시킨다. Markus Buehler 교수팀은 단순히 기존 물질을 ’탐색’하는 것을 넘어, 원하는 기능을 가진 새로운 분자를 ’창조’하는 생성(generative) 모델링을 시도했다.32 구체적인 목표는 AI를 이용해 바이러스의 스파이크 단백질이 인간 세포의 ACE2 수용체에 결합하는 것을 효과적으로 방해할 수 있는 새로운 아미노산 서열, 즉 완전히 새로운 단백질을 ’설계’하는 것이었다. 이는 AI가 거대한 단백질 구조 공간을 탐색하여 기존에 존재하지 않던 ‘가설적인’ 해결책을 능동적으로 제안하는 것으로, AI가 과학적 발견 과정의 창의적인 파트너가 될 수 있음을 시사한다.
-
패혈증 예측 (프로젝트 1): COVID-19 중증 환자의 주요 사망 원인 중 하나는 바이러스 감염에 대한 과도한 면역 반응으로 발생하는 패혈증(Sepsis)이다. Daniela Rus 교수팀은 환자의 혈액 샘플에서 채취한 백혈구의 현미경 이미지로부터 패혈증으로 진행될 미묘한 형태학적 징후를 AI가 조기에 발견하는 시스템을 개발하고자 했다.32 이는 AI가 인간 전문가의 눈으로는 포착하기 어려운 복잡한 시각적 패턴을 학습하고 분석하여, 치명적인 합병증을 예방하는 임상적 의사결정 지원 도구(Clinical Decision Support System)로 활용될 수 있음을 보여주는 대표적인 사례이다.
이 프로젝트들은 AI가 단순히 기존 데이터를 분석하여 효율성을 높이는 도구를 넘어, 가설을 생성하고(단백질 설계), 숨겨진 인과관계를 추론하며(EMR 분석), 시뮬레이션을 통해 미래를 예측하는(경제 모델링) 등 과학적 발견 과정 자체의 핵심 파트너가 될 수 있음을 보여준다. 즉, AI는 데이터 분석가, 가설 생성자, 미래 예측가의 역할을 복합적으로 수행하며, 인간 연구자와 협력하여 문제 해결의 속도와 깊이를 근본적으로 바꾸는 ’공동 과학자(Co-scientist)’로 진화하고 있다.36
5. 산업계 AI 기술 동향 및 플랫폼 업데이트
5.1 구글의 2020년 5월 코어 알고리즘 업데이트 분석
2020년 5월 4일, 구글은 검색 순위 결정 로직에 영향을 미치는 광범위한 ’코어 알고리즘 업데이트(Core Algorithm Update)’를 전 세계적으로 동시에 출시했다.37 이러한 코어 업데이트는 특정 스팸이나 편법 SEO(검색 엔진 최적화) 기법을 겨냥한 것이 아니라, 검색 결과의 전반적인 ’품질’과 ’관련성’을 평가하는 방식을 근본적으로 개선하기 위한 시도였다.39 이 업데이트는 당시 SEO 업계에서 ’괴물(monster)’이라 불릴 정도로 그 영향력이 컸던 것으로 평가된다.40
핵심 변화: 사용자 의도와 콘텐츠 품질 이해의 고도화
이번 업데이트의 가장 큰 특징은 검색어의 ’관련성(Relevancy)’을 판단하는 능력이 크게 향상되었다는 점이다.41 이는 단순히 웹페이지에 특정 키워드가 포함되어 있는지를 넘어, 사용자가 해당 검색어를 입력한 근본적인 ’의도(intent)’를 더 깊이 이해하고, 그 의도에 가장 충실하고 포괄적인 답변을 제공하는 고품질 콘텐츠를 상위에 노출시키려는 AI 기술의 진화를 반영한다.
이러한 능력의 기술적 기반에는 BERT(Bidirectional Encoder Representations from Transformers)와 같은 최신 자연어 이해(NLU) 기술의 발전이 있다. BERT는 단어의 문맥적 의미를 양방향으로 파악하여 언어의 미묘한 뉘앙스까지 이해할 수 있게 해준다. 2019년 10월 일부 영어 검색어에 처음 도입되었던 BERT는 2020년에 이르러 거의 모든 영어 검색어에 적용될 정도로 그 사용 범위가 확대되었으며, 이는 고도화된 언어 이해 능력이 구글 검색 알고리즘의 핵심이 되었음을 의미한다.39
E-A-T 원칙의 중요성 부각
코어 업데이트와 함께, 구글이 콘텐츠 품질을 평가하는 내부 가이드라인인 ‘E-A-T’ 원칙의 중요성이 다시 한번 부각되었다. E-A-T는 각각 전문성(Expertise), 권위성(Authoritativeness), 신뢰성(Trustworthiness)을 의미하며, 특히 사용자의 건강, 재정, 안전에 직접적인 영향을 미칠 수 있는 주제, 즉 ‘Your Money or Your Life (YMYL)’ 분야에서 더욱 중요한 평가 기준이 된다.38 5월 업데이트 이후, 실제 경험과 깊이 있는 전문 지식이 담긴 콘텐츠, 그리고 사회적으로 신뢰받는 출처에서 작성된 콘텐츠가 검색 순위에서 상승하는 경향이 뚜렷하게 관찰되었다.41
이러한 변화는 AI가 단순히 정보를 찾는 도구를 넘어, 콘텐츠의 ’신뢰성’과 ’전문성’이라는 추상적인 가치를 ’판단’하는 역할을 맡게 되었음을 시사한다. 초기 검색 엔진이 키워드 빈도나 백링크 수와 같은 비교적 객관적인 지표로 순위를 매겼다면, 이제 AI는 콘텐츠의 내용 자체를 이해하고 그 품질을 평가하는 단계로 나아갔다. 이는 AI가 정보의 ’사실 여부’를 넘어 ’믿을 만한가’를 판단하는 정보 생태계의 중요한 중재자(arbitrator) 역할을 하게 됨을 의미하며, 동시에 AI가 내리는 판단의 근거는 무엇이며 특정 관점에 편향될 위험은 없는지에 대한 사회적, 윤리적 논의의 필요성을 제기한다.
5.2 클라우드 AI와 비즈니스 솔루션 동향
팬데믹은 산업계 전반의 디지털 전환을 가속했으며, 특히 클라우드 기반 AI 솔루션의 도입을 촉진하는 계기가 되었다. 구글 클라우드는 팬데믹으로 인해 급증한 기업들의 비대면 서비스 수요에 대응하기 위해 AI 기반 솔루션을 신속하게 패키지화하여 제공했다.42
-
Contact Center AI (CCAI): 사회적 거리두기로 인해 콜센터 운영이 어려워지고 고객 문의가 폭주하는 상황에 대응하기 위해, 구글은 자연어 이해 기술을 활용한 가상 상담원(virtual agent)을 기업들이 신속하게 구축할 수 있도록 지원했다. CCAI는 24시간 고객 응대를 가능하게 하고, 상담원들은 더 복잡하고 중요한 문제에 집중할 수 있도록 하여 고객 서비스의 효율성과 질을 동시에 높였다.42
-
Document AI: 미국 정부가 중소기업 지원을 위해 시행한 급여 보호 프로그램(Paycheck Protection Program, PPP) 대출 신청이 폭주하자, 구글은 대출 서류에서 신청자 정보, 대출 금액 등 정형화된 정보를 자동으로 추출하는 Document AI 솔루션을 제공했다. 이는 AI가 반복적이고 수작업이 많이 필요한 비즈니스 프로세스를 자동화하여 효율성을 극대화하고, 위기 상황에서 신속한 행정 처리를 가능하게 한 대표적인 사례이다.43
이러한 사례들은 팬데믹이라는 외부 충격이 어떻게 AI 기술의 상용화 주기를 단축시키고, 특정 산업(고객 서비스, 금융 서류 처리)의 디지털 전환을 강제하는지를 보여준다. 평상시 기업들이 AI 도입에 대해 비용, 복잡성, 기존 프로세스와의 통합 문제 등으로 신중한 태도를 보였다면, 팬데믹 상황은 생존을 위한 기술 도입을 시급한 과제로 만들었다. 클라우드 AI 플랫폼들은 이러한 긴급한 수요(pain point)를 해결할 수 있는 즉시 배포 가능한 솔루션을 제공하며 시장을 빠르게 파고들었다. 결과적으로, 위기 상황은 AI 기술 도입의 장벽을 낮추고 그 효과를 실증하는 거대한 ‘테스트베드’ 역할을 함으로써, 팬데믹 이후에도 AI 기반 자동화가 ’뉴노멀’로 자리 잡는 중요한 기반을 마련했다.
6. 결론: 2020년 5월이 남긴 유산과 미래 과제
2020년 5월은 전 지구적 위기 속에서 인공지능과 로봇 공학 기술이 새로운 단계로 도약했음을 명확히 보여준 한 달이었다. 이 시기에 발표된 주요 연구 성과들은 기술의 ‘규모(Scale)’, ‘적용(Application)’, 그리고 ’상호작용(Interaction)’이라는 세 가지 핵심 축에서 중요한 전환점을 기록했다.
첫째, 규모의 전환이다. OpenAI의 GPT-3는 1,750억 개라는 전례 없는 규모의 매개변수를 통해, AI 모델의 성능이 규모에 따라 예측 가능하게 향상될 수 있다는 ’스케일링 법칙’을 입증하며 ‘초거대 AI’ 시대를 본격적으로 열었다.23 이는 단순히 모델을 크게 만드는 것을 넘어, ’인컨텍스트 학습’이라는 새로운 패러다임을 제시하며 AI의 활용 방식을 근본적으로 바꾸었다.
둘째, 적용의 전환이다. MIT-IBM Watson AI Lab의 COVID-19 대응 프로젝트와 구글 클라우드의 산업 솔루션들은 AI가 더 이상 학문적 탐구나 특정 산업의 효율화 도구에 머무르지 않고, 팬데믹과 같은 인류의 시급한 난제를 해결하는 실용적이고 핵심적인 도구로 자리매김했음을 증명했다.32 신약 재창출부터 경제 모델링에 이르기까지, AI는 과학적 발견과 사회적 문제 해결의 전면에 나섰다.
셋째, 상호작용의 전환이다. ICRA 2020 최우수 논문이 제시한 선호도 기반 외골격 제어는 인간과 AI의 관계가 일방적인 명령과 수행의 관계가 아니라, 지속적인 피드백을 통해 상호 적응하고 최적화하는 ’협력적 파트너십’으로 발전하고 있음을 상징적으로 보여주었다.10
그러나 이러한 눈부신 발전은 동시에 우리가 해결해야 할 새로운 과제를 남겼다. 초거대 모델의 막대한 자원 소모와 그에 따른 환경 문제 22, 훈련 데이터에 내재된 편향을 증폭시키는 AI의 윤리적 문제 30, 그리고 소수의 거대 기술 기업으로 핵심 기술과 데이터가 집중되는 현상은 AI 기술의 지속 가능하고 공정한 발전을 위해 반드시 해결해야 할 중요한 숙제이다. 결국 2020년 5월은 AI 기술의 무한한 가능성을 확인한 동시에, 그 기술을 책임감 있게 발전시켜야 할 인류의 무거운 과제를 다시 한번 확인시켜 준 중요한 시점으로 역사에 기록될 것이다.
7. 참고 자료
- Applications of Robotics, Artificial Intelligence, and Digital Technologies During COVID-19: A Review - PMC - PubMed Central, https://pmc.ncbi.nlm.nih.gov/articles/PMC8027549/
- AI, Robots, and Ethics in the Age of COVID-19 - MIT Sloan Management Review, https://sloanreview.mit.edu/article/ai-robots-and-ethics-in-the-age-of-covid-19/
- ICRA 2020 : IEEE International Conference on Robotics and Automation - Accepted Papers, Deadline, Impact Factor & Score 2025 | Research.com, https://research.com/conference/icra-2020
- ICLR 2020, https://iclr.cc/virtual_2020/
- ICLR 2020 Accepted Papers Announced - Synced Review, https://syncedreview.com/2019/12/20/iclr-2020-accepted-papers-announced/
- 2020 IEEE International Conference on Robotics and Automation - ICRA 2020, https://ewh.ieee.org/soc/ras/conf/fullysponsored/icra/ICRA2020/www.icra2020.org/index.html
- ICRA 2020 | Dynamic Systems Lab | Prof. Angela Schoellig, https://www.dynsyslab.org/icra-2020/
- PaoPaoRobot/ICRA2020-paper-list - GitHub, https://github.com/PaoPaoRobot/ICRA2020-paper-list
- 2020 IEEE International Conference on Robotics and Automation, ICRA 2020, Paris, France, May 31 - August 31, 2020 - researchr publication, https://researchr.org/publication/icra-2020
- IRCA Best Paper Awards - Information Science and Technology, https://ist.caltech.edu/news/irca-best-paper-awards
- [R] A List of Best Papers from Top AI Conferences in 2020 - Reddit, https://www.reddit.com/r/MachineLearning/comments/knai5q/r_a_list_of_best_papers_from_top_ai_conferences/
- Yanan Sui, https://yanansui.com/src/CV_YananSui202107.pdf
- Preference-Based Bayesian Optimization in High Dimensions with Human Feedback, https://cseweb.ucsd.edu/~jmcauley/workshops/scmls20/papers/scmls20_paper_29.pdf
- DP-Dueling: Learning from Preference Feedback without Compromising User Privacy - arXiv, https://arxiv.org/pdf/2403.15045
- response time improves choice prediction and function estimation for gaussian process models of perception and preferences - arXiv, https://arxiv.org/pdf/2306.06296
- artificial intelligence and - MIT Work of the Future, https://workofthefuture-taskforce.mit.edu/document/2020-research-brief-malone-rus-laubacher-2/
- When humans and AI work best together — and when each is better alone | MIT Sloan, https://mitsloan.mit.edu/ideas-made-to-matter/when-humans-and-ai-work-best-together-and-when-each-better-alone
- ICLR 2020 - Call For Papers, https://iclr.cc/Conferences/2020/CallForPapers
- 2020 Conference - ICLR 2026, https://iclr.cc/Conferences/2020
- [D] What are your favorite papers from ICLR 2020? + a list of our picks by domain. - Reddit, https://www.reddit.com/r/MachineLearning/comments/gn6j0m/d_what_are_your_favorite_papers_from_iclr_2020_a/
- Most Influential ICLR Papers – Resources - Paper Digest, https://www.paperdigest.org/2021/05/most-influential-iclr-papers-2021-05/
- MIT-IBM Watson AI Lab | MIT News | Massachusetts Institute of Technology, https://news.mit.edu/clp/mit-ibm-watson-ai-lab?page=8
- Language Models are Few-Shot Learners, https://arxiv.org/abs/2005.14165
- OpenAI GPT-3, the most powerful language model: An Overview - eInfochips, https://www.einfochips.com/blog/openai-gpt-3-the-most-powerful-language-model-an-overview/
- Better language models and their implications - OpenAI, https://openai.com/index/better-language-models/
- AI and compute | OpenAI, https://openai.com/index/ai-and-compute/
- What will AI look like in 2030? - Epoch AI, https://epoch.ai/blog/what-will-ai-look-like-in-2030
- GPT-4 - OpenAI, https://openai.com/index/gpt-4-research/
- GPT-3 powers the next generation of apps - OpenAI, https://openai.com/index/gpt-3-apps/
- Lessons learned on language model safety and misuse - OpenAI, https://openai.com/index/language-model-safety-and-misuse/
- Aligning language models to follow instructions - OpenAI, https://openai.com/index/instruction-following/
- Marshaling artificial intelligence in the fight against Covid-19 | MIT …, https://news.mit.edu/2020/mit-marshaling-artificial-intelligence-fight-against-covid-19-0519
- 10 MIT-IBM Watson AI Lab funded COVID-19 projects - D4 Pharma, https://d4-pharma.com/10-mit-ibm-watson-ai-lab-funded-covid-19-projects/
- The Watson AI Lab Funds 10 COVID-19 Research Projects - News - All About Circuits, https://www.allaboutcircuits.com/news/the-watson-ai-lab-funds-10-covid19-research-projects/
- A machine-learning approach to finding treatment options for Covid-19 | MIT News, https://news.mit.edu/2021/machine-learning-treatment-covid-19-0216
- Accelerating scientific breakthroughs with an AI co-scientist - Google Research, https://research.google/blog/accelerating-scientific-breakthroughs-with-an-ai-co-scientist/
- A Human Perspective on Google’s May 2020 Core Update | BusinessOnline - BOL Agency, https://www.bol-agency.com/blog/a-human-perspective-on-googles-may-2020-core-update
- The May 2020 Google Core Update – 4 Case Studies That Emphasize The Complexity Of Broad Core Algorithm Updates - Glenn Gabe, https://www.gsqi.com/marketing-blog/may-2020-google-core-update-case-studies/
- Google algorithm updates: The complete history - Search Engine Land, https://searchengineland.com/library/platforms/google/google-algorithm-updates
- Google algorithm updates 2020 in review: Core updates, passage indexing and page experience - Search Engine Land, https://searchengineland.com/google-algorithm-updates-2020-in-review-core-updates-passage-indexing-and-page-experience-345070
- An intensive analysis of the May 2020 Google Core Update by MHC - Marie Haynes, https://www.mariehaynes.com/may-2020-core-google-update/
- AI and machine learning news from Google Cloud, https://cloud.google.com/blog/products/ai-machine-learning/what-happened-week8-of-google-cloud-next20-onair
- How Cloud AI is helping during COVID-19, https://cloud.google.com/blog/products/ai-machine-learning/how-cloud-ai-helping-during-covid-19
- AI Principles 2020 Progress update - Google AI, https://ai.google/static/documents/ai-principles-2020-progress-update.pdf