년 2월 AI 및 로봇 연구 동향
1. 서론: 심층 학습 확산기의 기술적 변곡점
2017년은 심층 학습(Deep Learning) 기술이 학문적 탐구를 넘어 산업 전반으로 확산되며 그 무한한 잠재력과 명백한 한계를 동시에 드러내던 시기였다. 본 보고서는 특히 2017년 2월을 중심으로 발표된 주요 연구 성과를 분석하여, 당시의 기술적 변곡점과 학문적 담론의 흐름을 심도 있게 고찰하고자 한다.1
당대 최고의 인공지능(AI) 학회로 인정받는 ICLR(International Conference on Learning Representations)과 AAAI(AAAI Conference on Artificial Intelligence), 그리고 로봇 공학 분야의 대표 학회인 ICRA(International Conference on Robotics and Automation)에서 발표된 논문들은 당시 연구의 최전선을 명확히 보여준다. ICLR에서는 생성 모델과 표현 학습의 근본적인 이론이, AAAI에서는 다중 에이전트 시스템과 게임 이론이, ICRA에서는 로봇의 지각 및 제어 기술이 주요 의제로 다루어졌다.3
그러나 이 시기는 순수한 기술적 진보에만 머무르지 않았다. AI와 로봇이 고용, 경제, 그리고 인간의 심리에 미치는 영향에 대한 체계적인 연구가 본격화된 중요한 전환점이기도 하다. 기술적 낙관론과 사회적 우려가 교차하며, AI의 미래에 대한 다각적인 논의가 시작되었다.7 본 보고서는 이러한 기술적, 사회적 담론을 종합적으로 분석하여 2017년 2월이 AI 연구사에 남긴 유산을 조명한다.
2. 표현 학습과 생성 모델의 패러다임 전환: ICLR 2017을 중심으로
ICLR 2017은 심층 학습의 근본적인 원리를 탐구하고, 비지도 학습의 새로운 가능성을 연 기념비적인 학회였다. 특히, 데이터의 기저에 깔린 생성 요인(underlying generative factors)을 어떻게 효과적으로 학습하고 표현할 것인가에 대한 논의가 학계를 지배했다.
2.1 베타-VAE: 제약된 변분 프레임워크를 통한 시각 개념 학습
연구 배경 및 목표
기존의 변분 오토인코더(Variational Autoencoder, VAE)는 데이터를 효과적으로 압축하고 생성하는 능력을 보여주었으나, 학습된 잠재 공간(latent space)의 각 차원이 데이터의 어떤 의미론적 특징(예: 얼굴 이미지의 표정, 머리 방향, 조명)과 연결되는지 명확하지 않은 ‘얽힘(entanglement)’ 문제가 있었다. Google DeepMind의 Irina Higgins 등이 발표한 “beta-VAE: Learning Basic Visual Concepts with a Constrained Variational Framework” 연구의 핵심 목표는 완전한 비지도 방식으로 데이터 생성의 독립적인 요인들을 분리하여 학습하는 것, 즉 해석 가능한 ‘분리된(disentangled)’ 표현을 얻는 것이었다.4
핵심 방법론
연구진은 VAE의 목적 함수인 증거 하한(Evidence Lower Bound, ELBO)을 미세하게 수정하여 새로운 프레임워크 \beta-VAE`를 제안했다. 기존 VAE의 ELBO는 데이터 x와 잠재 변수 z에 대해 다음과 같이 재구성 오차(reconstruction error)와 정규화 항(regularization term)의 균형을 맞추는 형태로 구성된다.
\mathcal{L}(\theta, \phi; x, z) = \mathbb{E}_{q_{\phi}(z|x)}[\log p_{\theta}(x|z)] - D_{KL}(q_{\phi}(z|x) || p(z))
여기서 첫 번째 항은 인코더 q_{\phi}(z|x)가 만든 잠재 표현 z로부터 디코더 p_{\theta}(x|z)가 원본 데이터 x를 얼마나 잘 복원하는지를 측정하고, 두 번째 항인 쿨백-라이블러 발산(Kullback-Leibler divergence)은 인코더가 만든 사후 확률분포 q_{\phi}(z|x)가 사전 확률분포 p(z)(주로 표준정규분포)와 얼마나 유사한지를 측정하는 정규화 역할을 한다.
\beta-VAE는 이 정규화 항에 하이퍼파라미터 \beta를 곱하여 그 영향력을 조절한다.11
\mathcal{L}(\theta, \phi; x, z, \beta) = \mathbb{E}_{q_{\phi}(z|x)}[\log p_{\theta}(x|z)] - \beta D_{KL}(q_{\phi}(z|x) || p(z))
\beta > 1로 설정하면, 모델은 잠재 변수 z의 분포 q(z|x)를 사전 분포 p(z)에 더 강하게 근사시키도록 압박받는다. 이는 잠재 채널의 정보 용량을 제한하는 효과를 낳아, 모델이 한정된 ‘대역폭’ 안에서 데이터를 가장 효율적으로 표현하는 방법을 찾게 만든다. 그 결과, 모델은 데이터의 가장 핵심적이고 통계적으로 독립적인 생성 요인들만을 학습하여 잠재 변수의 각 차원에 할당하게 된다.4
실험 결과 및 의의
CelebA(유명인 얼굴), 3D Chairs 등 다양한 데이터셋을 이용한 실험에서, \beta-VAE는 기존 VAE나 당시 최신 기술이었던 InfoGAN보다 정성적으로 더 명확하게 분리된 잠재 표현을 학습함을 보였다. 예를 들어, 잠재 변수의 한 차원을 변화시키면 오직 얼굴의 좌우 방향만이 바뀌고 다른 특징(표정, 안경 유무 등)은 그대로 유지되는 결과를 얻었다. 더 나아가, 연구진은 분리도를 정량적으로 측정하는 새로운 프로토콜을 제안하여 \beta-VAE`의 우수성을 객관적으로 입증했다.4 이 연구는 복잡한 비지도 학습 문제에 간단한 수정을 가하여 모델의 해석 가능성과 제어 가능성을 크게 향상시킬 수 있음을 증명했으며, 이후 설명 가능한 AI(XAI) 및 제어 가능한 생성(controllable generation) 연구에 지대한 영향을 미쳤다.
2.2 생성적 적대 신경망(GAN)의 원리적 접근
Martin Arjovsky와 Léon Bottou가 발표한 “Towards Principled Methods for Training Generative Adversarial Networks” 연구는 당시 GAN 학습의 고질적인 문제였던 불안정성, 모드 붕괴(mode collapse) 등을 지적하며, 보다 원리적인 접근법의 필요성을 역설했다.15 이 연구는 이후 Wasserstein GAN (WGAN)으로 발전하는 핵심적인 이론적 토대를 마련했다. 연구진은 생성된 데이터 분포와 실제 데이터 분포 사이의 거리를 측정하기 위해 기존의 Jensen-Shannon 발산 대신, 분포 간의 거리를 더 안정적으로 측정할 수 있는 Earth-Mover (Wasserstein-1) 거리를 사용할 것을 제안했다. 이는 GAN의 학습 과정을 안정화하고, 생성된 이미지의 품질과 손실 함수의 값 사이에 의미 있는 상관관계를 제공하여 학습 과정을 투명하게 만들었다. 이 연구는 GAN 연구의 방향을 ‘어떻게든 잘 되게 만드는’ 경험적 트릭의 시대를 넘어, ’왜 잘 되는지’를 수학적으로 증명하고 보장하려는 이론적 탐구의 시대로 전환시키는 결정적인 계기가 되었다.
2.3 심층 학습의 일반화에 대한 재고찰
Chiyuan Zhang, Samy Bengio 등이 발표한 “Understanding deep learning requires rethinking generalization” 논문은 학계에 큰 충격을 던졌다.15 연구진은 심층 신경망이 실제 데이터의 레이블을 무작위로 뒤섞은, 전혀 의미 없는 데이터에 대해서도 훈련 데이터에 대한 정확도를 100% 가까이 달성할 수 있음을 실험적으로 보였다. 이는 모델이 단순히 데이터를 ’암기’할 수 있는 엄청난 용량을 가지고 있음을 의미한다.
이 발견은 파라미터 수가 데이터 수보다 훨씬 많은 심층 신경망이 어떻게 우수한 일반화 성능을 보이는지에 대한 기존의 통계적 학습 이론(예: VC 차원, Rademacher 복잡도)으로는 설명이 불가능함을 시사했다. 모델의 복잡도가 높으면 과적합이 발생해야 한다는 전통적인 관념에 정면으로 도전한 것이다. 이 연구는 심층 학습의 일반화 능력을 이해하기 위한 새로운 이론적 프레임워크가 시급히 필요함을 학계에 알리는 경종이 되었다. 이후 ‘sharp vs. flat minima’, ‘암시적 정규화(implicit regularization)’ 등 심층 학습의 고유한 특성을 설명하려는 다양한 이론 연구가 이 논문을 계기로 촉발되었다.
2017년 2월 ICLR에서 발표된 핵심 연구들은 AI 연구 커뮤니티가 마주한 근본적인 긴장감을 드러낸다. 한편에서는 ‘rethinking generalization’ 논문처럼 심층 학습 모델이 기존 이론의 틀을 벗어나는 방식으로 경이로운 성능을 달성하고 있음을 보여주며 성능 지상주의적 접근의 정점을 찍었다. 이는 동시에 모델의 작동 방식에 대한 우리의 이해가 얼마나 부족한지를 드러냈다. 다른 한편에서는 \beta-VAE` ``와 ‘principled GAN training’ 논문처럼, 이 강력하지만 통제되지 않는 ’블랙박스’에 수학적 원리와 제약을 가하여 그 내부 작동을 더 잘 ’이해’하고 ’제어’하려는 시도가 이루어졌다.
이 두 흐름은 서로 모순되는 것이 아니라, 심층 학습이라는 강력한 힘을 마주한 연구 커뮤니티의 성숙 과정을 보여주는 양면과 같다. 초기에는 성능 향상 자체가 목표였지만, 2017년 2월을 기점으로 ’어떻게(How)’를 넘어 ’왜(Why)’와 ’무엇을(What)’에 대한 질문이 학문적 담론의 중심으로 부상하기 시작했다. \beta-VAE` ``는 “모델이 무엇을 학습하는가?“에 대한 답을, ’principled GAN’은 “모델이 왜 안정적으로 학습해야 하는가?“에 대한 답을, ’rethinking generalization’은 “모델이 어떻게 일반화되는지에 대한 우리의 이해가 왜 틀렸는가?“라는 근본적인 질문을 던졌다. 이 세 질문은 이후 AI 연구의 주요한 흐름을 형성하는 시발점이 되었다.
2.4 표 1: ICLR 2017 주요 발표 논문 요약 (수정)
| 논문 제목 | 핵심 저자 (소속) | 주요 내용 및 기여 | 연구 분야 |
|---|---|---|---|
beta-VAE: Learning Basic Visual Concepts with a Constrained Variational Framework | Irina Higgins et al. (Google DeepMind) | VAE 목적 함수에 하이퍼파라미터 β를 추가하여 잠재 공간의 정보량을 제어. 이를 통해 비지도 방식으로 데이터의 생성 요인을 분리(disentangle)하는 데 성공했으며, 모델의 해석 가능성과 제어 가능성을 크게 향상함. | 생성 모델 (Generative Models), 표현 학습 (Representation Learning) |
| Towards Principled Methods for Training Generative Adversarial Networks | Martin Arjovsky, Léon Bottou | 기존 GAN 학습의 불안정성과 모드 붕괴 문제를 지적. 실제 데이터와 생성 데이터 분포 간의 거리 척도로 기존 JS 발산 대신 Wasserstein-1(Earth-Mover) 거리를 제안. WGAN의 이론적 토대를 마련하여 학습 안정성을 높임. | 생성 모델 (Generative Models), 딥러닝 이론 |
| Understanding deep learning requires rethinking generalization | Chiyuan Zhang, Samy Bengio et al. (Google Brain) | 심층 신경망이 무작위 레이블까지 완벽히 암기함을 보여줌. 이를 통해 모델의 복잡도만으로는 딥러닝의 일반화 성능을 설명할 수 없다는 것을 증명하고, 암시적 정규화 등 새로운 이론적 접근의 필요성을 제시함. | 딥러닝 이론 (Deep Learning Theory), 일반화 (Generalization) |
| Neural Architecture Search with Reinforcement Learning | Barret Zoph, Quoc V. Le (Google Brain) | 강화학습을 이용해 신경망 아키텍처를 자동으로 설계하는 ‘신경망 아키텍처 탐색(NAS)’ 방법론을 제시. 컨트롤러 RNN이 아키텍처를 제안하고, 그 성능을 보상으로 받아 학습하며 최적의 구조를 찾아내는 패러다임을 개척함. | AutoML, 신경망 아키텍처 탐색 (NAS) |
| Reinforcement Learning with Unsupervised Auxiliary Tasks | Max Jaderberg, Volodymyr Mnih et al. (Google DeepMind) | 주된 보상 신호 외에 픽셀 제어, 특징 제어 등 여러 비지도 보조 과제(auxiliary tasks)를 동시에 학습시켜 데이터 효율성과 학습 속도를 크게 향상시킨 UNREAL 에이전트를 제안. 풍부한 학습 신호를 통해 표현력을 높임. | 심층 강화학습 (Deep Reinforcement Learning) |
3. 강화학습과 순차적 의사결정의 진화
이 시기 강화학습(Reinforcement Learning, RL) 연구는 알고리즘의 효율성을 높이고, 심층 학습과의 결합을 통해 더 복잡한 문제에 도전하는 방향으로 나아갔다. 특히 학습 과정 자체를 최적화하거나, 더 나은 표현을 학습하는 데 초점을 맞춘 연구들이 주목받았다.
3.1 신경망 구조 탐색과 비지도 보조 과업
ICLR 2017에서 발표된 Google Brain의 “Neural Architecture Search with Reinforcement Learning” 연구는 최적의 신경망 구조를 설계하는 과정을 강화학습 문제로 새롭게 정의했다. 이 프레임워크에서 에이전트(컨트롤러 RNN)는 신경망의 구조(예: 필터 크기, 레이어 수)를 순차적으로 제안하는 행동(action)을 취한다. 제안된 구조로 실제 모델을 학습시킨 후, 검증 데이터셋에서의 성능을 보상(reward)으로 사용하여 정책 경사법(policy gradient)으로 컨트롤러를 업데이트한다. 이 방식은 인간 전문가의 직관과 수많은 시행착오에 의존하던 모델 설계를 자동화하는 AutoML(Automated Machine Learning) 분야의 중요한 이정표가 되었다.15
한편, DeepMind가 발표한 “Reinforcement Learning with Unsupervised Auxiliary Tasks“는 강화학습 에이전트의 학습 효율을 높이는 새로운 접근법을 제시했다. 이 연구는 주된 RL 과업(예: 게임에서 높은 점수 획득)을 학습하면서, 동시에 비지도 학습 기반의 보조 과업(예: 입력 이미지의 픽셀 제어, 특징 디코딩)을 함께 수행하도록 하는 프레임워크를 제안했다. 보상이 드물게 주어지는 희소한 보상(sparse reward) 환경에서, 이러한 보조 과업들은 에이전트가 환경에 대한 의미 있는 표현을 더 빨리 학습하도록 도와 데이터 효율성과 최종 성능을 크게 향상시켰다.15
3.2 정책 경사법과 Q-러닝의 결합
정책 경사법(Policy Gradient)과 Q-러닝(Q-learning)은 강화학습의 양대 산맥으로, 각각 장단점을 가진다. 이들을 효과적으로 결합하려는 시도는 액터-크리틱(Actor-Critic) 방법론의 핵심 과제였다. ICLR 2017에서 발표된 “Combining policy gradient and Q-learning” 연구는 Q-러닝의 off-policy 학습 능력(과거의 경험 데이터를 효율적으로 재사용하는 능력)과 정책 경사법의 안정성을 결합하는 새로운 방식을 제안했다. 이는 이후 Soft Actor-Critic (SAC)과 같은 최첨단 알고리즘의 발전에 중요한 이론적, 실험적 기반을 제공했다.15
2017년 2월의 강화학습 연구는 단순히 특정 환경에서 보상을 최대화하는 정책을 찾는 전통적인 목표를 넘어서고 있었다. Neural Architecture Search는 강화학습을 이용해 ’모델 구조’라는 한 차원 높은 대상을 탐색함으로써, 강화학습의 적용 범위를 전통적인 게임이나 로봇 제어를 넘어 ’AI 모델 설계’라는 메타 레벨로 확장했다. 동시에, Auxiliary Tasks 연구는 강화학습 에이전트의 성공이 결국 좋은 ’상태 표현(state representation)’에 달려있다는 점에 주목했다. 이는 제1장에서 논의된 표현 학습의 중요성이 강화학습 분야에도 직접적으로 연결됨을 보여준다.
이러한 흐름은 강화학습이 더 이상 순수한 ‘제어(control)’ 문제 해결 도구에 머무르지 않음을 시사한다. 강화학습은 이제 (1) 어려운 탐색 문제를 해결하는 ‘범용 최적화 도구’(NAS의 경우)이자, (2) 환경과의 풍부한 상호작용 데이터를 활용하여 유용한 표현을 학습하는 ‘비지도/자기지도 학습 프레임워크’(Auxiliary Tasks의 경우)로 그 역할이 확장되고 있었다. 이는 강화학습이 AI의 다른 하위 분야들과 깊이 융합되며 그 지평을 넓히기 시작했음을 보여주는 중요한 신호였다.
4. 다중 에이전트 시스템과 게임 이론의 접점: AAAI 2017을 중심으로
AAAI 2017에서는 여러 에이전트 간의 전략적 상호작용을 모델링하고 최적의 전략을 찾기 위한 게임 이론적 접근이 활발하게 논의되었다. 이는 AI의 초점이 단일 에이전트의 지능에서 복수 에이전트 시스템의 집단 지능으로 이동하고 있음을 보여준다.3
4.1 팀-맥스민 균형: 효율성 한계와 알고리즘 분석
Nicola Basilico 등이 발표한 “Team-Maxmin Equilibrium: Efficiency Bounds and Algorithms” 연구는 다중 에이전트 시스템의 현실적인 제약을 분석한 대표적인 사례다.20
연구 목표
이 연구는 ’팀’으로 묶인 여러 플레이어가 서로 통신이나 행동 동기화 없이 공동의 목표를 위해 적대자와 대결하는 상황을 분석한다. 이러한 상황에서의 최적 전략 해법인 ’팀-맥스민 균형(Team-Maxmin Equilibrium)’은 존재성과 유일성이 알려져 있었으나, 그 특성과 계산 방법에 대해서는 거의 연구되지 않았다. 이 논문은 이 균형의 효율성 한계를 정량적으로 분석하고, 이를 계산하기 위한 알고리즘을 제안하는 것을 목표로 했다.20
게임 이론적 접근
팀-맥스민 균형은 팀원들이 서로의 행동을 독립적으로 결정해야 한다는 제약 하에서, 적대자의 최선의 대응에 대해 팀의 최소 보상을 최대화하는 내쉬 균형이다. 연구진은 이 균형의 효율성을 두 가지 기준과 비교했다. 첫째, 팀원들이 협력하지 않고 각자 이기적으로 행동할 때의 내쉬 균형과 비교하여 팀 구성의 가치를 측정했다(Price of Anarchy). 둘째, 팀원들이 완벽하게 행동을 조율(상관 전략)할 수 있을 때의 맥스민 균형과 비교하여 통신 부재로 인한 손실을 측정했다(Price of Uncorrelation).20
결과 및 의의
분석 결과, 팀 구성의 부재(내쉬 균형)는 팀-맥스민 균형에 비해 임의로 나쁜 결과를 초래할 수 있는 반면, 통신의 부재(팀-맥스민 균형)는 완벽한 통신(상관 균형)에 비해 점근적으로만 손실을 야기함을 보였다. 이는 제한된 협력 상황에서도 팀을 구성하는 것 자체가 매우 중요함을 시사한다. 또한, 이 균형을 계산하기 위한 여러 알고리즘을 제시하고 실험적으로 평가함으로써, 보안 게임, 분산 자원 할당 등 현실적인 다중 에이전트 문제에 대한 이론적 토대와 실용적 도구를 제공했다.20
4.2 보안, 경제, 사회적 상호작용에서의 게임 이론적 접근
AAAI 2017의 ‘게임 이론 및 경제 패러다임’ 트랙에서는 중간자 공격(Man-In-The-Middle Attack)에 대한 최적의 개인화 방어 전략, 시민들의 선호를 반영하여 공공 예산을 배분하는 참여 예산 책정(Participatory Budgeting), 그리고 소셜 네트워크에서의 인기와 사회적 응집력 분석 등 다양한 응용 분야에 게임 이론을 적용한 연구들이 다수 발표되었다.3 이는 AI가 단일 에이전트의 지능을 넘어, 복잡한 사회적, 경제적 맥락 속에서 복수의 주체 간 상호작용을 이해하고 최적화하는 방향으로 나아가고 있음을 명확히 보여준다.
팀-맥스민 균형 연구는 다중 에이전트 시스템 연구가 이상적인 완전 정보, 완전 통신 환경에서 벗어나, 통신 불가, 행동 비동기화와 같은 현실적인 제약을 모델링하기 시작했음을 상징적으로 보여준다. 이 연구의 핵심은 ’목표는 공유하지만, 행동은 동기화할 수 없다’는 제약 조건으로, 이는 분산된 로봇 군집, 독립적으로 운영되는 사이버 보안 시스템 등 현실 세계의 많은 시나리오를 정확하게 반영한다.
’Price of Uncorrelation’이라는 개념을 통해 ’완벽한 협력’과 ‘통신이 불가능한 협력’ 사이의 성능 차이를 정량화한 것은 특히 중요하다. 이는 이론적 최적해와 현실적으로 달성 가능한 해 사이의 간극을 수학적으로 분석한 것으로, AI 연구의 실용주의적 전환을 의미한다. 즉, 이론적으로 가장 좋은 해법을 찾는 것을 넘어, 현실적인 제약 조건 하에서 ’가장 좋은 차선책’은 무엇이며, 그 차선책이 이상적인 해법에 비해 얼마나 손실을 보는지를 분석하는 것이 중요해졌다. 이는 AI 시스템을 실제 세계에 배포할 때 반드시 고려해야 할 신뢰성, 강건성 문제와 직결되는 접근법이다.
5. 로보틱스 기술의 발전: 지각, 제어, 상호작용
로봇 공학 분야에서는 심층 학습의 성공을 발판 삼아, 로봇의 핵심 기능인 지각(perception), 계획(planning), 제어(control) 능력을 향상시키기 위한 연구가 활발히 진행되었다. 특히 ICRA 2017에서는 고전적인 기하학적, 동역학적 모델과 최신 데이터 기반 학습 방법론을 융합하려는 시도가 두드러졌다.6
5.1 자율 이동을 위한 시각-관성 항법 시스템 (VINS)
GPS가 없는 실내나 고층 빌딩이 밀집한 도심 환경에서 로봇이나 드론이 자신의 위치와 자세를 정확하게 추정하는 것은 자율 이동의 핵심 기술이다. ICRA 2017에서 Mrinal K. Paul 등이 발표한 “A comparative analysis of tightly-coupled monocular, binocular, and stereo VINS” 논문은 카메라(Visual) 정보와 관성 측정 장치(Inertial Measurement Unit, IMU)를 강하게 결합(tightly-coupled)하는 시각-관성 항법 시스템(Visual-Inertial Navigation System, VINS) 기술을 심도 있게 비교 분석했다. 이 연구는 다양한 카메라 구성(단안, 양안, 스테레오)에 따른 성능과 계산 복잡도를 체계적으로 평가하여, 특정 응용 분야와 하드웨어 제약에 맞는 최적의 센서 시스템을 선택할 수 있는 중요한 가이드라인을 제시했다.22
5.2 심층 학습 기반 강체 운동 표현 및 물체 조작
Arunkumar Byravan과 Dieter Fox가 발표한 “SE(3)-Nets: Learning rigid body motion using deep neural networks” 연구는 3차원 공간에서의 강체 변환(회전 및 이동)을 표현하는 리 군(Lie group) SE(3)을 심층 신경망에 통합하는 새로운 방법을 제안했다. 기존의 신경망이 3D 회전을 오일러 각도 등으로 표현할 때 발생하는 비선형성 및 특이점 문제를, SE(3)의 기하학적 구조를 직접 활용하여 해결했다. 이를 통해 네트워크가 3D 객체의 움직임을 보다 자연스럽고 효율적으로 학습할 수 있게 하여, 3D 비전 및 로봇 조작 분야에 새로운 접근법을 제시했다.22
또한, ICRA 2017에서는 ’Soft Manipulation and Collaborative Assembly’와 같은 워크숍이 개최되어, 인간과 로봇이 물리적으로 상호작용하며 복잡한 조립 과업을 수행하는 기술이 집중적으로 논의되었다. Sergey Levine, Alberto Rodriguez 등 해당 분야의 세계적인 석학들이 연사로 참여하여, 센서 기반의 반응형 기술, 인간의 시연으로부터 기술을 학습하는 방법(learning from demonstration), 그리고 유연한 물체 조작 등이 주요 주제로 다루어졌다. 이는 로봇이 고정된 프로그램에 따라 반복 작업을 수행하는 단계를 넘어, 인간과 협력하며 예측 불가능한 환경에 적응하는 방향으로 진화하고 있음을 보여준다.23
2017년 로보틱스 연구의 핵심적인 특징은 고전적 기하학 및 동역학 이론과 최신 심층 학습의 융합이었다. VINS 연구는 칼만 필터와 같은 고전적인 상태 추정 이론과 카메라의 기하학적 모델을 기반으로 하며, SE(3)-Nets는 미분 기하학의 리 군 이론을 신경망 아키텍처에 직접 통합한다. 이는 모든 것을 데이터로부터 학습하려는 순수한 ‘end-to-end’ 심층 학습 접근법과는 다른 철학을 공유한다. 즉, 우리가 이미 알고 있는 물리 세계의 강력한 사전 지식(prior knowledge)을 모델 설계에 적극적으로 활용하는 것이다.
이러한 하이브리드 접근법은 로보틱스 분야의 고유한 특성에서 기인한다. 로봇은 가상 세계가 아닌 물리 법칙이 지배하는 현실 세계와 상호작용해야 하므로, 데이터만으로는 학습하기 어려운 물리적 제약을 모델에 내장하는 것이 데이터 효율성, 안전성, 일반화 성능 측면에서 훨씬 유리하다. 2017년 2월은 이러한 ‘하이브리드’ 접근법, 즉 고전적 모델 기반(model-based) 방식과 최신 데이터 기반(data-driven) 방식의 장점을 결합하려는 시도가 본격화되는 중요한 시점이었음을 보여준다.
6. 인공지능의 사회경제적 영향과 대중 인식
기술의 급격한 발전은 필연적으로 사회적 수용 문제와 마주한다. 2017년 2월을 전후하여 AI 기술의 사회적 파급력에 대한 학문적, 정책적 논의가 급증했으며, 이는 ‘객관적 위험’ 분석과 ‘주관적 공포’ 연구라는 두 가지 흐름으로 나타났다.
6.1 자율 로봇과 인공지능에 대한 두려움(FARAI) 분석
Yuhua Liang과 Seungcheol Austin Lee가 발표하고 2017년 2월 28일에 승인된 “Fear of Autonomous Robots and Artificial Intelligence: Evidence from National Representative Data with Probability Sampling” 논문은 AI와 로봇에 대한 대중의 ’두려움’을 사회학적 관점에서 정량적으로 분석한 선구적인 연구다.9
연구진은 미국 성인 1,541명을 대상으로 한 확률 표본 설문 데이터를 사용하여, ’자율 로봇 및 인공지능에 대한 두려움(Fear of Autonomous Robots and Artificial Intelligence, FARAI)’이라는 새로운 개념을 제시하고 그 정도를 측정했다. 주요 결과에 따르면, 응답자의 약 26%가 높은 수준의 FARAI를 경험하는 것으로 나타났다. 특히 FARAI는 실업에 대한 두려움, 드론 기술에 대한 두려움과 유의미한 상관관계를 보였으며, 공상과학(SF) 미디어에 대한 노출이 FARAI를 예측하는 중요한 변수임이 밝혀졌다. 이는 AI에 대한 대중의 인식이 기술 자체의 복잡성이나 원리에 대한 이해보다는, 그것이 초래할 것으로 예상되는 사회경제적 불안감 및 문화적 내러티브와 깊게 연관되어 있음을 강력하게 시사한다.9
6.2 고용 시장 자동화 위험에 대한 정량적 분석
2017년 3월에 발표되었지만 그 분석 기반은 2017년 초의 상황을 반영하는 PwC의 보고서는 영국, 미국, 독일, 일본의 직업 자동화 위험도를 분석했다. 이 보고서는 영국 직업의 최대 30%가 2030년대 초까지 자동화될 위험이 높으며, 특히 운송 및 보관(56%), 제조업(46%), 도소매업(44%) 분야의 위험이 크다고 예측했다.8
한편, 일본의 경제학자 Masayuki Morikawa는 2017년에 발표한 여러 논문에서 일본의 개인 및 기업 설문조사를 바탕으로 AI와 로봇이 고용에 미치는 영향을 분석했다. 그의 연구는 고등 교육, 특히 과학 및 공학 분야를 통해 습득한 유연하고 적응 가능한 고숙련 기술이 AI와 같은 신기술과 대체 관계가 아닌 보완적인 관계에 있음을 시사했다. 즉, 자동화로 인해 일부 직업이 대체되는 동시에, 새로운 기술과 시너지를 내는 고숙련 직업의 가치는 더욱 높아질 수 있음을 보여주었다.7
2017년 2월은 AI의 사회적 영향에 대한 논의가 두 가지 중요한 트랙으로 동시에 진행되었음을 보여준다. 하나는 PwC와 Morikawa의 연구처럼 경제학적 데이터를 기반으로 ’객관적’인 고용 대체 위험을 분석하는 흐름이고, 다른 하나는 FARAI 연구처럼 설문조사를 통해 대중의 ’주관적’인 불안과 공포를 측정하는 흐름이다.
이 두 흐름은 서로 분리된 것이 아니라 강하게 연결되어 있다. PwC 등이 제시하는 ’수십 퍼센트의 직업이 사라질 수 있다’는 객관적 데이터는 FARAI 연구에서 나타나는 대중의 주관적 공포를 유발하고 증폭시키는 중요한 배경이 된다. 특히 FARAI가 실제 기술에 대한 이해도보다는 ’실업 불안’과 더 강하게 연관된다는 결과는, 사람들이 AI 기술 자체를 두려워하기보다는 AI가 초래할 ’사회경제적 결과’를 두려워하고 있음을 명확히 보여준다. 따라서 2017년 2월은 AI 기술의 성공적인 사회적 수용을 위해서는 기술 개발뿐만 아니라, 경제적 안전망 구축과 긍정적인 사회적 내러티브 관리가 동시에 이루어져야 한다는 중요한 정책적 함의를 던져준 시점이라 할 수 있다.
7. 결론: 2017년 2월이 남긴 유산
2017년 2월에 발표된 연구들은 이후 AI 기술 지형도를 근본적으로 바꾸는 데 기여했다. \beta-VAE` ``는 표현 학습의 새로운 지평을 열었고, WGAN의 이론적 토대는 고품질 생성 모델의 시대를 열었으며, ’rethinking generalization’은 심층 학습 이론 연구를 촉발했다. Neural Architecture Search와 Auxiliary Tasks는 강화학습의 응용 범위를 넓혔고, 팀-맥스민 균형 연구는 현실적인 다중 에이전트 시스템 설계에 중요한 이론적 기반을 제공했다.
무엇보다 이 시기는 AI 연구가 순수한 성능 경쟁을 넘어, ‘이해’, ‘제어’, ‘상호작용’, ’사회적 영향’이라는 키워드를 중심으로 재편되기 시작한 중요한 변곡점이었다. 기술의 내적 원리에 대한 탐구와 외적 영향에 대한 성찰이 동시에 심화되면서, AI는 더 이상 공학적 도구에 머무르지 않고 사회 전반과 상호작용하는 복합적인 연구 분야로 자리매김하게 되었다.
이때 제기된 문제들, 즉 해석 가능성, 일반화 이론, 다중 에이전트 협력, 그리고 사회적 수용성은 오늘날까지도 AI 연구의 가장 중요하고 도전적인 과제로 남아있다. 2017년 2월은 이러한 거대 담론의 서막을 본격적으로 연 시기로, AI 연구의 역사에서 중요한 의미를 지닌다.
8. 참고 자료
- Artificial Intelligence and Robotics - 2017 - PwC India, https://www.pwc.in/assets/pdfs/publications/2017/artificial-intelligence-and-robotics-2017.pdf
- SQ2. What are the most important advances in AI? | One Hundred Year Study on Artificial Intelligence (AI100) - Stanford University, https://ai100.stanford.edu/gathering-strength-gathering-storms-one-hundred-year-study-artificial-intelligence-ai100-2021-1/sq2
- Vol. 31 No. 1 (2017): Thirty-First AAAI Conference on Artificial …, https://ojs.aaai.org/index.php/AAAI/issue/view/302
- ICLR 2017 Conference Track - OpenReview, https://openreview.net/group?id=ICLR.cc/2017/conference
- ICLR 2017, https://iclr.cc/archive/www/doku.php%3Fid=iclr2017:main.html
- ICRA 2017: Singapore - PAL Robotics, https://pal-robotics.com/blog/icra-2017/
- Who Are Afraid of Losing Their Jobs to Artificial Intelligence and Robots? Evidence from a Survey - IDEAS/RePEc, https://ideas.repec.org/p/zbw/glodps/71.html
- Will robots steal our jobs? The potential impact of automation - PwC UK, https://www.pwc.co.uk/economic-services/ukeo/pwcukeo-section-4-automation-march-2017-v2.pdf
- Fear of Autonomous Robots and Artificial Intelligence: Evidence …, https://www.researchgate.net/publication/314719350_Fear_of_Autonomous_Robots_and_Artificial_Intelligence_Evidence_from_National_Representative_Data_with_Probability_Sampling
- beta-VAE: Learning Basic Visual Concepts with a Constrained Variational Framework, https://openreview.net/forum?id=Sy2fzU9gl
- β-VAE: LEARNING BASIC VISUAL CONCEPTS WITH A …, https://www.cs.toronto.edu/~bonner/courses/2022s/csc2547/papers/generative/disentangled-representations/beta-vae,-higgins,-iclr2017.pdf
- Summary: Beta-VAE: Learning Basic Visual Concepts with a Constrained Variational Framework | by Robert L. Logan IV | UCI NLP | Medium, https://medium.com/uci-nlp/summary-beta-vae-learning-basic-visual-concepts-with-a-constrained-variational-framework-91ad843b49e8
- β-VAE: LEARNING BASIC VISUAL CONCEPTS WITH A CONSTRAINED VARIATIONAL FRAMEWORK, https://papers.baulab.info/papers/also/Higgins-2017.pdf
- beta-VAE: Learning Basic Visual Concepts with a Constrained Variational Framework, https://www.semanticscholar.org/paper/beta-VAE%3A-Learning-Basic-Visual-Concepts-with-a-Higgins-Matthey/a90226c41b79f8b06007609f39f82757073641e2
- ICLR 2017 Accepted Paper List - Paper Copilot, https://papercopilot.com/paper-list/iclr-paper-list/iclr-2017-paper-list/
- ICLR2017 Open Review Explorer, https://horace.io/OpenReviewExplorer/?conf=iclr2017
- AAAI’s seven highlights: Experience the International Artificial, https://en.eeworld.com.cn/mp/leiphone/a32597.jspx
- What’s Hot Talks - AAAI - The Association for the Advancement of Artificial Intelligence, https://aaai.org/conference/aaai/aaai-18/whats-hot-talks/
- Reports of the AAAI 2017 Fall Symposium Series | AI Magazine, https://ojs.aaai.org/aimagazine/index.php/aimagazine/article/view/2813
- Team–Maxmin Equilibrium: Efficiency Bounds … - AAAI Publications, https://ojs.aaai.org/index.php/AAAI/article/view/10560/10419
- [1611.06134] Team-maxmin equilibrium: efficiency bounds and algorithms - arXiv, https://arxiv.org/abs/1611.06134
- 2017 IEEE International Conference on Robotics and Automation, ICRA 2017, Singapore, Singapore, May 29 - June 3, 2017 - researchr publication, https://researchr.org/publication/icra-2017
- Sensor-Based Object Manipulation for Collaborative Assembly, https://sites.google.com/view/somca