년 4분기 AI 및 로봇 연구 동향

년 4분기 AI 및 로봇 연구 동향

1. 2010년 4분기, 지능형 시스템 연구의 변곡점

2010년 4분기는 인공지능(AI)과 로봇공학 분야에서 이론적 심화와 실용적 확장이 동시에 이루어진 중요한 시기였다. 이 기간에 개최된 주요 학술대회들은 이후 10년간의 연구 방향을 결정짓는 핵심적인 아이디어들을 배출했다. 본 보고서는 이 시기의 주요 연구 성과를 심층적으로 분석하여 그 기술적 의의와 역사적 맥락을 조명한다.1 이 시점의 연구들은 단순히 새로운 알고리즘을 제안하는 것을 넘어, 기존 기술들이 실제 세계의 복잡성과 불확실성에 직면했을 때 발생하는 근본적인 한계들을 해결하려는 성숙한 접근을 보여주었다.

세 가지 핵심적인 거시적 동향이 관찰된다. 첫째, 기계 학습 이론의 성숙이다. 알고리즘의 이론적 성능을 증명하는 단계를 넘어, 현실 세계의 ‘불완전한(dirty)’ 데이터와 확률적 불확실성 하에서의 ’강건성(robustness)’을 확보하려는 이론적 노력이 두드러졌다. 이는 AI가 실험실 환경을 벗어나 실용적인 문제 해결 도구로 자리 잡기 위한 필연적인 과정이었다. 둘째, 로봇 자율성의 고도화이다. 대규모 환경에서의 실시간 처리를 목표로 하는 동시적 위치 추정 및 지도 작성(SLAM) 알고리즘의 효율성 증대와, 인간과의 상호작용 및 생체모방을 통한 로봇 기능의 다각화가 가속화되었다. 이는 로봇이 더 넓고 복잡한 공간에서 인간과 공존하며 유용한 작업을 수행하기 위한 기반 기술이 성숙하고 있음을 시사한다. 셋째, 응용 AI의 지평 확장이다. 고도로 복잡한 가상 환경, 특히 실시간 전략 게임이 AI 연구의 새로운 시험장으로 부상했으며, 의료, 금융 등 다양한 산업 분야로의 AI 기술 확산이 본격화되었다.

이 시기의 연구 동향은 신경정보처리시스템학회(NIPS), 지능형 로봇 및 시스템 국제 콘퍼런스(IROS), 인공지능 및 인터랙티브 디지털 엔터테인먼트 콘퍼런스(AIIDE), 로봇공학 및 생체모방 국제 콘퍼런스(ROBIO), 실험 로봇공학 국제 심포지엄(ISER) 등 세계 최고 수준의 학술대회를 통해 발표되고 논의되었다. 각 학회는 고유한 초점을 가지면서도 상호 보완적으로 해당 분기의 기술적 파노라마를 형성했다.1 본 보고서는 이들 학술대회에서 발표된 핵심 연구들을 중심으로 2010년 4분기가 지능형 시스템 연구의 역사에서 어떤 의미를 갖는지 심도 있게 분석하고자 한다.

표 1: 2010년 4분기 주요 AI 및 로봇공학 학술대회 요약

학술대회명 (약칭)개최 기간개최지주요 초점 및 의의
제6회 인공지능 및 인터랙티브 디지털 엔터테인먼트 콘퍼런스 (AIIDE 2010)2010년 10월 11일-13일미국 스탠포드게임 AI, 인터랙티브 내러티브. 최초의 스타크래프트 AI 대회 개최. 1
제6회 인공지능 응용 및 혁신 국제 콘퍼런스 (AIAI 2010)2010년 10월 6일-7일키프로스 라르나카다양한 산업 분야에서의 AI 응용 사례 발표 (예: 의료 진단). 9
IEEE/RSJ 지능형 로봇 및 시스템 국제 콘퍼런스 (IROS 2010)2010년 10월 18일-22일대만 타이베이지능형 로봇 및 시스템 전반. 특히 SLAM, 자율 주행, 휴머노이드 등. 2
제18회 로봇공학 국제 콘퍼런스 (RA 2010)2010년 11월 1일-3일미국 케임브리지로봇공학, 원격 로봇공학 및 다양한 응용 분야. 10
제24회 신경정보처리시스템학회 (NIPS 2010)2010년 12월 6일-11일캐나다 밴쿠버기계 학습, 계산 신경과학 분야의 최고 권위 학회. 핵심 이론 및 알고리즘 발표. 5
IEEE 로봇공학 및 생체모방 국제 콘퍼런스 (ROBIO 2010)2010년 12월 14일-18일중국 톈진로봇공학과 생체모방 기술의 융합. 보행 로봇, 의료 로봇, 군집 로봇 등. 3
제12회 실험 로봇공학 국제 심포지엄 (ISER 2010)2010년 12월 18일-21일인도 델리실험을 통해 검증된 로봇공학 이론 및 원리에 초점. 4

2. 기계 학습의 근본적 진화: NIPS 2010 주요 연구 심층 분석

2010년 12월 캐나다 밴쿠버에서 개최된 제24회 신경정보처리시스템학회(NIPS 2010, 현 NeurIPS)는 기계 학습 분야의 핵심적인 이론적 진보를 선보인 장이었다. 이 시기 연구들은 단순히 새로운 모델을 제안하는 데 그치지 않고, 기존 알고리즘들이 가진 근본적인 한계를 명확히 지적하고 이를 극복하기 위한 정교하고 강건한 대안을 제시하는 데 집중했다. 특히 다중 과업 학습, 강화 학습, 앙상블 방법론, 신경망 아키텍처 분야에서 발표된 논문들은 이후 연구 지형에 깊은 영향을 미쳤다.5

2.1 다중 과업 학습의 강건성 확보: ’더티 모델(A Dirty Model)’의 등장

기존의 다중 과업 학습(Multi-task Learning, MTL)은 여러 과업이 특징(feature)을 공유한다는 가정 하에 성능 향상을 꾀했다. 이를 위해 \ell_1/\ell_q 블록-정규화(block-regularization)와 같은 기법이 널리 사용되었다. 그러나 이 방식은 모든 과업이 정확히 동일한 특징 집합을 공유하고, 심지어 관련 파라미터 값까지 유사해야 한다는 비현실적인 ‘깨끗한(clean)’ 가정을 전제했다. 현실 세계의 데이터는 이처럼 이상적이지 않다. 일부 특징은 모든 과업에 공통적일 수 있지만, 다른 특징들은 특정 과업에만 특화되어 있을 수 있다. 이러한 ’더티(dirty)’한 상황에서 기존의 블록-정규화 방식은 특징 공유가 불완전할 경우, 오히려 각 과업을 독립적으로 학습시키는 것보다 성능이 저하되는 심각한 문제를 보였다.17

Ali Jalali 등의 논문 “A Dirty Model for Multi-task Learning“은 이러한 현실적인 ‘더티 데이터’ 문제를 해결하기 위해, 파라미터 행렬 \Theta를 두 개의 독립적인 구성 요소로 분해하는 혁신적인 아이디어를 제안했다. 즉, 파라미터 행렬을 여러 과업에 걸쳐 공통적으로 사용되는 특징을 나타내는 행-희소(row-sparse) 행렬 B와, 각 과업에 개별적으로 사용되는 특징을 나타내는 원소별-희소(element-wise sparse) 행렬 S의 중첩(\Theta = B + S)으로 모델링한 것이다.18

  • 행렬 B는 그룹 Lasso 정규화(\ell_1/\ell_q)를 통해 행 전체가 희소해지도록(즉, 소수의 특징만이 모든 과업에 공통적으로 관여하도록) 유도된다. 이는 과업들 간의 공유 구조를 포착하는 역할을 한다.
  • 행렬 S는 표준 Lasso 정규화(\ell_1)를 통해 행렬의 개별 원소들이 희소해지도록(즉, 특정 과업에만 관여하는 특징이 존재하도록) 유도된다. 이는 각 과업의 고유성을 모델링하는 역할을 한다.

제안된 모델은 다음의 최적화 문제를 통해 파라미터 B와 S를 동시에 학습한다.
\min_{\Theta = B+S} \frac{1}{2n} \sum_{k=1}^{r} \| y^{(k)} - X^{(k)} \Theta^{(k)} \|_2^2 + \lambda_B \|B\|_{1,q} + \lambda_S \|S\|_1
여기서 첫 번째 항은 데이터에 대한 손실 함수이며, \|B\|_{1,q} = \sum_j \|B_j\|_q는 행-희소성을 유도하는 그룹 정규화 항, \|S\|_1 = \sum_{j,k} \vert S_{j,k} \vert는 원소별 희소성을 유도하는 표준 정규화 항이다.18 \lambda_B\lambda_S는 두 정규화의 강도를 조절하는 하이퍼파라미터다.

이 ’더티 모델’의 기여는 단순히 두 종류의 정규화를 결합한 것을 넘어선다. 이는 특징 공유의 정도를 미리 알 수 없는 현실적인 상황에서, 모델이 데이터로부터 공유 구조의 존재 여부와 그 정도를 스스로 학습하도록 만든다는 점에서 근본적인 패러다임의 전환을 의미한다. 공유 구조가 강하게 존재할 때는 B 행렬이 지배적이 되어 기존 블록-정규화의 이점을 취하고, 공유 구조가 약하거나 없을 때는 S 행렬이 지배적이 되어 각 과업을 독립적으로 학습하는 것과 유사한 효과를 낸다. 이처럼 모델이 고정된 구조적 가정을 강요받는 대신, 데이터에 내재된 구조의 복잡성을 유연하게 학습하도록 설계한 것은 ‘메타-러닝’ 또는 ‘학습을 위한 학습’ 개념의 초기 형태로 볼 수 있다. 이는 모델의 아키텍처와 가정이 데이터 자체에 의해 결정되어야 한다는, 이후 AI 연구의 중요한 흐름을 예고하는 통찰이었다.17

2.2 강화 학습의 신뢰도 향상: 이중 Q-러닝(Double Q-learning)

Watkins의 Q-러닝은 강화 학습 분야의 초석을 다진 알고리즘이지만, 보상이나 상태 전이가 확률적인 환경(stochastic environments)에서 행동 가치(action values)를 고질적으로 과대평가(overestimation)하는 심각한 문제가 있었다. 이 문제는 Q-러닝의 업데이트 식에서 다음 상태의 가치를 추정할 때 max 연산자를 사용하기 때문에 발생한다. 추정된 Q-값들 중 최댓값을 선택하는 행위는 추정 오차 중 양의 오차를 선택할 확률을 높여, 결과적으로 가치 추정치에 양의 편향(positive bias)을 누적시킨다.22

Hado van Hasselt의 논문 “Double Q-learning“은 이 문제를 해결하기 위해, 하나의 Q 함수 대신 **두 개의 독립적인 Q 함수 추정량(Q^AQ^B)**을 사용하는 ‘이중 추정량(double estimator)’ 방법을 도입했다. 이 방법의 핵심은 최적 행동을 ’선택’하는 과정그 행동의 가치를 ’평가’하는 과정을 서로 다른 추정량을 사용하여 분리하는 것이다. 이는 max 연산에 내재된 편향의 고리를 끊는 결정적인 역할을 한다.24

Double Q-learning의 업데이트 메커니즘은 다음과 같다. 매 타임 스텝마다 50%의 확률로 Q^A 또는 Q^B 중 하나를 업데이트하도록 선택한다. 예를 들어 Q^A를 업데이트하는 경우, 프로세스는 두 단계로 나뉜다.

  1. 선택(Selection): 다음 상태 s'에서 가치를 최대로 만드는 행동 a^*를 현재 업데이트 대상인 Q^A를 이용해 찾는다. 즉, a^* = \arg\max_a Q^A(s', a)이다.
  2. 평가(Evaluation): 위에서 선택된 행동 a^*의 가치는 업데이트 대상이 아닌 다른 추정량, 즉 Q^B를 이용해 평가한다. 목표 가치(target value)에 사용되는 값은 Q^B(s', a^*)가 된다.

결과적으로 Q^A의 업데이트 수식은 다음과 같이 표현된다.
Q^A(s, a) \leftarrow Q^A(s, a) + \alpha(s, a) \left( r + \gamma Q^B(s', \arg\max_a Q^A(s', a)) - Q^A(s, a) \right)
이 수식은 기존 Q-러닝의 업데이트 식과 비교할 때, 목표 가치를 계산하는 부분에서 max 연산이 평가 대상인 Q^B가 아닌 선택 대상인 Q^A에만 적용되는 결정적인 차이를 보인다. 행동을 선택하는 데 사용된 Q 함수와 그 행동의 가치를 평가하는 데 사용된 Q 함수가 다르기 때문에, 특정 행동의 가치가 우연히 높게 추정되었더라도 그 편향이 업데이트 과정에 직접적으로 전파되는 것을 방지한다.24

이중 Q-러닝은 강화 학습 알고리즘의 안정성과 신뢰도를 크게 향상시킨 중요한 이론적 진보였다. 이 아이디어는 이후 심층 강화 학습(Deep Reinforcement Learning) 분야에서 심층 Q-네트워크(Deep Q-Network, DQN)의 과대평가 문제를 해결하기 위한 Double DQN으로 직접 계승되어, Atari 게임 정복과 같은 기념비적인 성과를 내는 데 핵심적인 이론적 토대가 되었다.26

표 2: 표준 Q-러닝과 이중 Q-러닝 비교

항목표준 Q-러닝 (Standard Q-Learning)이중 Q-러닝 (Double Q-Learning)
업데이트 수식Q(s, a) \leftarrow Q(s, a) + \alpha [r + \gamma \max_{a'} Q(s', a') - Q(s, a)]Q^A(s, a) \leftarrow Q^A(s, a) + \alpha
다음 상태 가치 추정단일 추정량 (Single Estimator)이중 추정량 (Double Estimator)
편향 원인max 연산자로 인한 양의 편향 (Positive bias from max operator)선택과 평가를 분리하여 편향 제거
핵심 메커니즘선택과 평가가 결합됨 (Coupled Selection & Evaluation)선택과 평가가 분리됨 (Decoupled Selection & Evaluation)

2.3 멀티클래스 부스팅의 이론적 토대 정립: “A Theory of Multiclass Boosting”

부스팅(Boosting)은 여러 개의 약한 분류기(weak classifier)를 결합하여 강력한 예측 모델을 만드는 앙상블 기법이다. AdaBoost와 같은 알고리즘 덕분에 이진 분류(binary classification) 문제에서는 그 이론적 기반이 잘 정립되어 있었다. 하지만 클래스의 개수가 셋 이상인 다중 클래스(multiclass) 문제에서는 상황이 달랐다. 약한 학습기(weak learner)가 만족해야 할 ‘올바른’ 최소 조건이 무엇인지, 그리고 가장 효율적인 부스팅 알고리즘이 어떤 형태여야 하는지에 대한 통일된 이론적 프레임워크가 부재한 상태였다.27

Indraneel Mukherjee와 Robert Schapire의 논문 “A Theory of Multiclass Boosting“은 이러한 이론적 공백을 메우기 위해, 부스팅 과정을 **’부스터(Booster)’와 ‘약한 학습기(Weak-Learner)’ 간의 제로섬 게임(zero-sum game)**으로 공식화하는 광범위하고 일반적인 프레임워크를 제안했다. 이 프레임워크 내에서 약한 학습기의 성능 조건을 수학적으로 명확히 정의하고, 그 조건 하에서 최적의 성능(가장 빠른 수렴 속도)을 내는 부스팅 알고리즘을 설계할 수 있음을 보였다.28

이 게임 이론적 관점에서, 매 라운드마다 ’부스터’는 각 학습 데이터에 대해 클래스별로 다른 비용을 할당한 비용 행렬(cost matrix)을 ’약한 학습기’에게 제시한다. ’약한 학습기’는 이 비용을 최소화하는 약한 분류기를 반환하는 것을 목표로 한다. 이때, 약한 학습기가 보장해야 하는 최소한의 성능이 바로 ’약한 학습 조건’이다.

논문의 핵심 기여는 멀티클래스 부스팅이 가능하기 위한 필요충분조건에 해당하는 약한 학습 조건을 규명한 것이다. 이들은 약한 학습기가 ‘무작위 추측보다 약간 더 나은’ 성능을 내야 한다는 직관적인 조건을 여러 형태로 정밀하게 공식화했으며, 이 조건들의 합집합(union)이 부스팅 가능성을 결정짓는다는 것을 이론적으로 증명했다. 이를 통해 기존의 유명한 멀티클래스 부스팅 알고리즘들이 암묵적으로 가정했던 조건들의 문제점을 명확히 할 수 있었다.28

  • AdaBoost.M1AdaBoost.MH가 요구하는 조건은 필요 이상으로 너무 강해서(strictly stronger), 실제로는 유용할 수 있는 약한 학습기를 활용하지 못하는 한계가 있었다.
  • SAMME이 요구하는 조건은 반대로 너무 약해서(too weak), 조건을 만족하더라도 훈련 오류를 줄이는 것을 보장할 수 없었다.
  • 반면, **AdaBoost.M2(AdaBoost.MR)**가 요구하는 조건은 부스팅 가능성에 대해 정확히 필요충분조건임이 밝혀졌다.

이 연구는 멀티클래스 부스팅 분야의 오랜 난제였던 이론적 기반을 체계적으로 정립했다는 점에서 큰 학술적 의의를 가진다. 어떤 조건 하에서 부스팅이 가능한지를 명확히 함으로써, 더 효율적이고 안정적인 알고리즘 개발의 길을 열었으며, 이는 앙상블 학습 연구의 이론적 깊이를 한 단계 끌어올린 중요한 성과로 평가된다.27

2.4 합성곱 신경망의 표현력 확장: 타일드 CNN (Tiled CNNs)

전통적인 합성곱 신경망(CNN)의 핵심적인 설계 원리 중 하나는 가중치 공유(weight tying 또는 weight sharing)였다. 이미지의 모든 위치에서 동일한 특징 추출기(필터)를 공유함으로써, 학습해야 할 파라미터의 수를 획기적으로 줄이고 이미지의 위치 변화에 강건한 병진 불변성(translational invariance)을 자연스럽게 확보했다. 그러나 이처럼 아키텍처에 ’하드코딩’된 병진 불변성은 강력한 사전 지식(prior)인 동시에, 모델이 회전(rotation)이나 크기 변화(scale)와 같은 더 복잡한 형태의 불변성을 데이터로부터 학습하는 것을 방해하는 제약으로 작용하기도 했다.31

Jiquan Ngiam, Andrew Ng 등이 발표한 논문 “Tiled convolutional neural networks“는 이러한 한계를 극복하기 위해 ‘타일드(tiled)’ 가중치 공유라는 새로운 방식을 제안했다. 이는 기존 CNN의 완전한 가중치 공유 제약을 완화한 것이다. 전통적인 CNN이 인접한 모든 은닉 유닛이 동일한 가중치를 공유하도록 강제했다면, 타일드 CNN은 k 스텝만큼 떨어진 유닛들끼리만 가중치를 공유하도록 제약한다. 여기서 타일의 크기를 나타내는 k가 1일 때가 전통적인 CNN에 해당하며, k가 커질수록 가중치 공유의 제약은 약해진다.31

이러한 이완된 가중치 공유 방식은 모델에 중요한 유연성을 부여한다. 풀링(pooling) 계층의 유닛들은 이제 동일한 필터가 아닌, **서로 다른 필터(basis function)**에 의해 활성화된 하위 유닛들의 출력을 종합할 수 있게 된다. 예를 들어, 어떤 풀링 유닛은 수직 엣지를 감지하는 필터의 출력과 45도 기울어진 엣지를 감지하는 필터의 출력을 함께 입력받을 수 있다. 이를 통해 네트워크는 데이터에 내재된 복잡한 통계적 패턴을 스스로 학습하여, 병진 불변성을 넘어선 회전, 크기, 시점 변화 등 더 고차원적인 불변성을 획득할 수 있는 능력을 갖게 된다.32

타일드 CNN은 불변성을 설계자가 미리 정해주는 것이 아니라, 데이터로부터 ’학습’의 대상으로 삼아야 한다는 중요한 철학적 전환을 제시했다. 이는 신경망의 표현력(representational power)을 한 단계 끌어올리는 계기가 되었다. ’더티 모델’과 마찬가지로, 타일드 CNN 역시 모델의 구조적 가정을 완화하고 데이터가 스스로 말하게 함으로써 더 강력한 성능을 달성할 수 있음을 보여주었다. 이러한 아이디어는 이후 다양한 변형 CNN 아키텍처 연구에 깊은 영감을 주었으며, 딥 러닝에서 특징 표현 학습(feature representation learning)의 중요성을 다시 한번 부각시키는 역할을 했다.33

표 3: 표준 CNN과 타일드 CNN의 구조적 비교

항목표준 CNN (Standard CNN)타일드 CNN (Tiled CNN)
가중치 공유 방식완전 공유 (모든 위치에서 동일한 필터, k=1)k-스텝 공유 (k만큼 떨어진 위치에서만 동일한 필터)
인접 유닛 가중치동일 (Identical)다를 수 있음 (Can be different)
학습 가능한 불변성병진 불변성 (주로 하드코딩됨)복합 불변성 (회전, 크기 등 데이터로부터 학습)
파라미터 수최소 (Minimal)k 값에 따라 조절 가능 (표준 CNN보다 많고, 완전 비공유보다 적음)

3. 자율 이동 로봇 기술의 도약: IROS 2010 핵심 연구

2010년 10월 대만 타이베이에서 개최된 IEEE/RSJ 지능형 로봇 및 시스템 국제 콘퍼런스(IROS 2010)는 로봇공학 분야의 실질적인 기술 발전을 가늠할 수 있는 중요한 학술 행사였다. 이 시기 로봇 연구의 핵심 화두는 단연 ’자율성’의 고도화였으며, 이를 뒷받침하는 핵심 기술인 동시적 위치 추정 및 지도 작성(SLAM) 분야에서 의미 있는 진전이 있었다. 특히, 로봇의 활동 반경이 넓어짐에 따라 대규모 환경에서의 실시간 적용을 위한 그래프 기반 SLAM의 최적화 연구가 큰 주목을 받았다. 이 외에도 생체모방, 의료, 군집 로봇 등 다양한 플랫폼과 응용 기술들이 발표되며 로봇공학의 저변 확대를 보여주었다.2

3.1 대규모 환경에서의 실시간 SLAM: 효율적 희소 포즈 조정(SPA)

SLAM 기술은 로봇이 미지의 환경을 탐색하며 자신의 위치를 추정하고 동시에 지도를 작성하는 핵심적인 자율 주행 기술이다. 초기 EKF-SLAM과 같은 필터 기반 방식은 시간이 지남에 따라 불확실성이 누적되고 계산량이 증가하는 한계가 있었다. 이에 대한 대안으로 등장한 그래프 기반 SLAM은 로봇의 경로(포즈)와 관측 정보(제약 조건)를 하나의 거대한 그래프로 표현하고, 이를 전체적으로 최적화하여 일관성 있는 지도와 경로를 얻는 방식이다. 이 방식은 더 정확하고 강건하지만, 새로운 루프 폐쇄(loop closure, 이전에 방문했던 장소를 다시 인식하는 것)가 발생할 때마다 전체 그래프를 재최적화해야 하므로 계산 비용이 매우 높다는 치명적인 단점이 있었다. 특히 로봇이 탐색하는 환경이 커질수록 이러한 최적화 과정은 실시간 처리를 불가능하게 만드는 심각한 병목 현상이었다.40

Kurt Konolige 등의 논문 “Efficient Sparse Pose Adjustment for 2D mapping“은 바로 이 문제를 정면으로 다루었다. 이 연구는 그래프 최적화의 핵심인 비선형 최소 제곱 문제, 특히 Levenberg-Marquardt(LM) 알고리즘 내부에서 반복적으로 풀어야 하는 거대하고 희소한(sparse) 선형 시스템(H\Delta x = b)을 어떻게 효율적으로 해결할 것인가에 집중했다. 이들은 **직접적인 희소 Cholesky 분해(direct sparse Cholesky decomposition)**를 사용하여 이 선형 부문제를 매우 빠르게 해결하는 SPA(Sparse Pose Adjustment) 기법을 제안했다.41

SPA의 기술적 기여는 크게 두 가지로 요약할 수 있다. 첫째, 선형 시스템의 정보 행렬 H를 구성할 때 컴퓨터의 캐시 메모리 구조를 고려하여 캐시 미스(cache miss)를 최소화하는 메모리 효율적인 행렬 구성 방식을 고안했다. 이는 동일한 연산을 수행하더라도 실제 계산 시간을 크게 단축시키는 효과를 가져왔다.40 둘째, LM 알고리즘과 희소 Cholesky 분해를 결합하여 단 몇 번의 반복만으로 빠르게 최적해에 수렴하도록 만들었다. 실험 결과, 수천 개의 노드를 가진 대규모 맵의 전체 최적화에도 수백 밀리초(ms)밖에 걸리지 않았으며, 점진적으로 노드를 추가하며 최적화하는 데는 15ms 미만이 소요됨을 보여주었다.41

SPA의 등장은 그래프 기반 SLAM의 계산적 한계를 극복하고, 대규모 환경에서도 실시간(on-line)으로 맵을 지속적으로 최적화할 수 있는 길을 연 핵심적인 기술적 돌파구였다. 이는 로봇이 복잡한 실제 환경을 자율적으로 탐색하고 정밀한 지도를 작성하는 능력을 한 단계 끌어올렸다. 이 연구는 이후 ’Karto SLAM’이라는 오픈소스 패키지로 구현되어 로봇 커뮤니티에 널리 보급되었으며, 후속 SLAM 연구에 큰 영향을 미쳤다.41 이러한 알고리즘의 발전은 2D LiDAR와 같은 신뢰성 높은 센서 기술의 보급과 맞물려 시너지를 창출했다. 강력한 알고리즘은 센서 데이터의 가치를 극대화하고, 신뢰성 있는 센서는 알고리즘이 더 복잡한 문제에 도전할 수 있는 기반을 제공하는 선순환 구조가 형성된 것이다.

3.2 로봇공학의 다각화: 생체모방, 의료, 군집 로봇 연구 동향

IROS 2010 및 동 분기에 개최된 ROBIO 2010, ISER 2010에서는 SLAM 외에도 로봇 기술의 응용 범위를 넓히는 다양한 연구들이 발표되었다. 이는 로봇공학이 단순히 이동 문제를 넘어, 인간의 삶과 사회에 더 깊숙이 관여하려는 방향으로 발전하고 있음을 보여준다.

  • 보행 로봇 및 생체모방: 동물의 움직임을 모방하여 효율성과 안정성을 높이려는 연구가 활발했다. 이족 및 사족 보행 로봇의 안정적인 보행 패턴 생성, 동적 균형 제어, 그리고 물고기 로봇의 유체역학적 추진 방식에 대한 분석 등은 자연에서 영감을 얻어 로봇의 물리적 한계를 극복하려는 시도였다.3
  • 의료 및 재활 로봇: 인간의 건강과 삶의 질 향상에 직접적으로 기여하는 로봇 기술이 큰 주목을 받았다. 복강경과 같은 최소 침습 수술을 보조하는 의료 로봇, 뇌졸중 환자의 상지 재활을 돕기 위해 개발된 착용형 로봇(exoskeleton) 등은 정밀한 제어 기술과 안전한 인간-로봇 상호작용이 결합된 대표적인 사례다.3 이러한 응용 분야의 요구는 액추에이터, 센서, 그리고 안전 메커니즘과 같은 하드웨어 기술의 혁신을 견인하는 중요한 동력이 되었다.
  • 군집 로봇 및 자가 조립: 단일 로봇의 능력을 넘어, 여러 로봇의 협력을 통해 복잡한 임무를 수행하려는 연구가 심화되었다. 개미 군집 최적화(ACO) 알고리즘을 개선하여 여러 로봇이 실내에서 냄새의 근원지를 추적하거나, 지역적 통신만을 사용하여 자원을 수집하는 알고리즘 등이 발표되었다. 더 나아가, 로봇 스스로가 부품이 되어 다른 형태의 로봇이나 구조물을 조립하는 모듈형 자가 조립 로봇에 대한 연구도 활발히 진행되었다.3
  • 인간-로봇 상호작용(HRI): 로봇이 인간과 같은 공간에서 안전하고 효율적으로 작업하기 위한 기술이 탐구되었다. 특히 IROS 2010의 워크숍에서는 로봇이 음악을 인식하고, 리듬에 맞춰 춤을 추거나 악기를 연주하는 등, 기능적 상호작용을 넘어선 감성적, 사회적 상호작용의 가능성을 모색하는 새로운 형태의 HRI 연구가 논의되었다.4

이처럼 2010년 4분기의 로봇 연구는 알고리즘의 심화(SLAM)와 응용의 다각화가 동시에 이루어지는 역동적인 모습을 보여주었다. 소프트웨어 혁신이 더 야심 찬 로봇 응용을 가능하게 하고, 다시 그 응용 분야의 특수한 요구가 새로운 하드웨어 기술의 발전을 촉진하는, 기술 생태계의 건강한 공진화(co-evolution)가 관찰되는 시기였다.

4. 응용 AI의 지평 확장

2010년 4분기는 순수 이론 연구를 넘어, AI 기술이 복잡한 현실 문제와 접목되며 그 가능성을 시험하고 응용 범위를 넓혀가던 시기였다. 특히 고도로 복잡한 가상 환경이 AI의 새로운 시험장으로 부상했으며, 의료, 금융, 제조 등 전통적인 산업 분야로의 기술 확산이 가속화되었다. 이 시기의 응용 AI 연구는 한 가지 흥미로운 특징을 보여준다. NIPS를 중심으로 한 기계 학습 커뮤니티가 통계적, 데이터 기반의 접근법에 집중했던 반면, 복잡한 응용 문제를 다루는 연구들은 여전히 기호적(symbolic), 지식 기반의 접근법에 크게 의존하고 있었다.

4.1 AI 연구의 새로운 시험장: 제1회 AIIDE 스타크래프트 AI 대회

2010년 10월 스탠포드 대학에서 열린 AIIDE 2010(인공지능 및 인터랙티브 디지털 엔터테인먼트 콘퍼런스)에서는 역사상 처음으로 스타크래프트 AI 대회가 공식적으로 개최되었다. 이는 AI 연구의 역사에서 중요한 이정표였다. 체스나 바둑과 같은 완전 정보, 턴제 보드게임을 넘어, 실시간성(real-time), 불완전 정보(imperfect information), 다개체 제어(multi-agent control) 등 현실 세계의 복잡성을 그대로 담고 있는 실시간 전략 게임(RTS)이 AI 연구의 공식적인 시험장이 되었음을 의미하는 상징적인 사건이었기 때문이다.1

스타크래프트는 AI에게 극도로 어려운 도전 과제를 제시한다. 플레이어는 한정된 자원을 효율적으로 관리하고, 건물을 건설하며, 유닛을 생산하는 거시적 전략(macro-management)을 수립하는 동시에, 전투 시 개별 유닛들을 정교하게 제어하는 미시적 제어(micro-management)를 수행해야 한다. 또한, 전장의 안개(fog of war)로 인해 상대방의 정보를 완벽하게 알 수 없으므로, 지속적인 정찰을 통해 상대의 의도를 추론하고 그에 맞춰 자신의 전략을 유연하게 수정해야 한다. 이러한 복합적인 요구사항은 기존 AI 기술의 한계를 시험하는 이상적인 환경을 제공했다.48

제1회 대회의 참가 봇들은 당시 AI 기술의 현주소를 명확히 보여주었다. 2010년 당시의 통계적 기계 학습 방법론은 스타크래프트와 같은 거대하고 계층적인 문제 공간에서 장기적인 전략 계획을 수립하는 데 어려움을 겪었다. 따라서 대회 우승 봇들은 종단간 학습(end-to-end learning) 방식이 아닌, 전문가의 지식과 논리를 기반으로 한 모듈화된 기호적 AI 접근법에 크게 의존했다. 예를 들어, UC 버클리 팀이 개발한 우승 봇은 유닛의 이동과 교전을 위해 적응형 포텐셜 필드(adaptive potential fields)와 위협 인지 경로 탐색(threat-aware pathfinding) 알고리즘을 사용했으며, 준우승 봇은 전문가의 게임 지식을 유한 상태 기계(finite-state machines)로 인코딩하여 활용했다.1

이는 당시 AI 연구의 두 갈래, 즉 통계적 학습과 기호적 추론이 아직 통합되지 않고 각자의 영역에서 발전하고 있었음을 보여준다. 통계적 기계 학습 커뮤니티는 강력한 저수준 도구(인식, 가치 함수 근사)를 만들고 있었고, 응용 AI 커뮤니티는 복잡한 도메인에서 유능한 행동을 구현하기 위해 고수준 추론 시스템을 수작업으로 구축하고 있었다. AIIDE 스타크래프트 대회의 시작은 이 두 세계를 연결해야 한다는 과제를 수면 위로 끌어올렸으며, 이후 딥마인드의 알파고(AlphaGo)와 알파스타(AlphaStar)와 같이 심층 학습(통계적)과 탐색/계획 알고리즘(기호적/구조적)을 결합하는 하이브리드 접근법의 성공을 예고하는 중요한 계기가 되었다.48

4.2 다양한 산업 분야로의 AI 기술 확산

2010년 4분기에는 게임뿐만 아니라 다양한 응용 분야에서 AI 기술을 접목하려는 시도가 활발히 이루어졌다. 이는 AI가 특정 학문 분야를 넘어 범용 기술로서의 잠재력을 인정받기 시작했음을 보여준다.

  • 의료 진단: AIAI 2010 학회 및 ICGST(International Journal on Artificial Intelligence and Machine Learning) 저널 등에서는 임상적 의사결정을 지원하는 기계 학습 기술이 다수 발표되었다. 부스팅된 결정 트리(Boosted Decision Trees)를 이용한 유방암 진단 시스템, 그리고 의사의 진단을 보조하기 위한 전문가 시스템(Expert System for Medical Diagnostic Assistance) 등이 그 예이다. 이는 데이터 기반의 예측 모델이 인간 전문가의 판단을 보완하거나 자동화할 수 있는 가능성을 보여주었다.9
  • 금융 및 경제 예측: 금융 시장의 불확실성을 예측하려는 시도도 있었다. 하이브리드 시그모이드 대각 순환 신경망(Hybrid Sigmoid Diagonal Recurrent Neural Networks)과 향상된 입자 군집 최적화(Enhanced Particle Swarm Optimization)를 결합하여 주가 지수의 움직임을 예측하는 연구가 발표되었다. 이는 복잡한 시계열 데이터 분석에 신경망과 최적화 기법을 결합한 초기 사례 중 하나였다.49
  • 인간-컴퓨터 상호작용(HCI): 인간의 의도를 기계에 직접 전달하려는 노력도 있었다. 비침습적 뇌-컴퓨터 인터페이스(Non-Invasive BCI)를 사용하여 사용자의 생각만으로 휴머노이드 로봇을 제어함으로써 원격 현존감(remote presence)을 달성하려는 연구가 시도되었다. 이는 미래의 HCI 기술이 나아갈 방향을 제시하는 선구적인 연구였다.49
  • 로봇 제조: 제조 공정의 효율성을 높이기 위해 AI를 활용하려는 연구도 진행되었다. International Journal of Knowledge and Systems Science에 발표된 한 연구는 지식 기반 시스템(Knowledge-Based System)을 통해 로봇 제조 공정에서 숙련된 인간 작업자의 암묵적 지식(tacit knowledge)을 포착, 공유하고 재사용하려는 방법을 제안했다. 이는 AI가 물리적 자동화를 넘어 지적 자산의 관리와 활용에도 기여할 수 있음을 보여주었다.50

이러한 다양한 응용 사례들은 2010년 4분기가 AI 기술이 학계를 넘어 산업 현장의 구체적인 문제 해결에 기여하기 시작한 중요한 시점이었음을 증명한다.

5. 결론: 2010년의 유산과 2011년의 전망

2010년 4분기는 인공지능과 로봇공학이 ’가능성’의 단계를 지나 ’신뢰성’과 ’확장성’이라는 새로운 화두를 향해 나아가던 중요한 전환기였다. 이 시기의 연구들은 화려한 돌파구보다는, 기존 기술의 내실을 다지고 현실 세계의 복잡성에 대응하기 위한 근본적인 체질 개선에 집중하는 성숙한 모습을 보여주었다.

기계 학습 분야에서는 불완전하고 잡음이 많은 현실 세계의 데이터에 대응하기 위한 강건한 알고리즘(더티 모델, 이중 Q-러닝)과, 고정된 가정에서 벗어나 데이터로부터 직접 유연한 표현을 학습하는 모델(타일드 CNN)이 등장했다. 이는 알고리즘의 신뢰도를 높이고 표현력을 확장함으로써, 이후 딥 러닝 혁명이 폭발할 수 있는 비옥한 이론적 토양을 마련했다.

로봇공학 분야에서는 대규모 SLAM의 실시간 처리를 가능케 하는 핵심 최적화 기술(SPA)이 발표되어, 자율 로봇의 활동 반경을 물리적으로, 그리고 개념적으로 확장할 수 있는 길을 열었다. 이는 로봇이 더 이상 제한된 실험실 환경이 아닌, 넓고 복잡한 실제 공간에서 유용한 작업을 수행할 수 있는 잠재력을 갖추게 되었음을 의미한다.

이러한 각 분야의 발전은 독립적으로 이루어진 것이 아니라, 상호 보완적인 관계 속에서 미래 기술의 융합을 예고했다. NIPS에서 논의된 강건한 학습 이론은 AIIDE의 스타크래프트 AI와 같은 복잡한 동적 환경에서의 의사결정 문제에 장기적으로 적용될 수 있는 기초 체력을 길렀다. IROS에서 발표된 효율적인 SLAM 기술은 로봇이 더 풍부하고 넓은 범위의 데이터를 수집하여, 기계 학습 모델의 성능을 향상시킬 수 있는 선순환 구조의 가능성을 열었다.

결론적으로, 2010년 4분기에 나타난 ‘강건성(Robustness)’, ‘효율성 및 확장성(Efficiency & Scalability)’, 그리고 ’복잡한 현실 세계로의 도전(Tackling Real-World Complexity)’이라는 세 가지 핵심 키워드는 이후 10년의 연구를 지배하게 될 딥 러닝 혁명과 자율 주행 기술의 폭발적인 성장을 예고하는 명백한 서막이었다. 이 시기는 미래를 향한 조용하지만 근본적인 도약이 이루어진 시기로, AI와 로봇공학의 역사에서 중요한 변곡점으로 평가될 수 있다.

6. 참고 자료

  1. Recap of the 2010 AI and Interactive Digital Entertainment Conference - ResearchGate, https://www.researchgate.net/publication/220605491_Recap_of_the_2010_AI_and_Interactive_Digital_Entertainment_Conference
  2. International Conference on Intelligent Robots and Systems - Wikipedia, https://en.wikipedia.org/wiki/International_Conference_on_Intelligent_Robots_and_Systems
  3. 2010 IEEE International Conference on Robotics and Biomimetics, ROBIO 2010, Tianjin, China, December 14-18, 2010 - researchr publication, https://researchr.org/publication/robio-2010
  4. Special Issue on the Twelfth International Symposium on Experimental Robotics, 2010, https://www.researchgate.net/publication/254098815_Special_Issue_on_the_Twelfth_International_Symposium_on_Experimental_Robotics_2010
  5. 2010 Dates and Deadlines - NeurIPS 2025, https://neurips.cc/Conferences/2010/Dates
  6. IROS 2010 - Openresearch, https://www.openresearch.org/wiki/IROS_2010
  7. The Sixth AAAI Conference on Artificial Intelligence and Interactive Digital Entertainment (AIIDE-10), https://aaai.org/conference/aiide-2/aiide10/
  8. IEEE-ROBIO 2010 : 2010 IEEE International Conference on Robotics and Biomimetics : December 14-18, 2010, Tianjin, China - UConn Library, https://search.lib.uconn.edu/discovery/fulldisplay?docid=alma99420422490502432&context=L&vid=01UCT_STORRS:01UCT&lang=en&adaptor=Local%20Search%20Engine&tab=Everything&query=sub%2Cexact%2C%20Biomimetics%20%2CAND&mode=advanced&offset=0
  9. Artificial Intelligence Applications and Innovations: 6th IFIP WG 12.5 International Conference, AIAI 2010, Larnaca, Cyprus, October 6-7, 2010, Proceedings | Request PDF - ResearchGate, https://www.researchgate.net/publication/264859294_Artificial_Intelligence_Applications_and_Innovations_6th_IFIP_WG_125_International_Conference_AIAI_2010_Larnaca_Cyprus_October_6-7_2010_Proceedings
  10. The 15th IASTED International Conference on Robotics and Applications RA 2010, https://www.iasted.org/conferences/home-706.html
  11. 2010 Conference - NeurIPS 2025, https://neurips.cc/Conferences/2010
  12. ISER - International Foundation of Robotics Research, http://ifrr.org/iser
  13. Advances in Neural Information Processing Systems 23 (NIPS 2010), https://proceedings.neurips.cc/paper/2010
  14. 24th Annual Conference on Neural Information Processing Systems 2010. Proceedings of a meeting held 6-9 December 2010, Vancouver, British Columbia, Canada - researchr publication, https://researchr.org/publication/nips-2010
  15. NIPS 2010 Papers - NeurIPS 2025, https://neurips.cc/virtual/2010/papers.html
  16. NeurIPS 2010 Accepted Paper List - Paper Copilot, https://papercopilot.com/paper-list/neurips-paper-list/neurips-2010-paper-list/
  17. A Dirty Model for Multi-task Learning - NIPS, https://papers.nips.cc/paper/4125-a-dirty-model-for-multi-task-learning
  18. A Dirty Model for Multi-task Learning - SLD Group @ UT Austin, https://users.ece.utexas.edu/~sanghavi/mtdm_final.pdf
  19. A Dirty Model for Multi-task Learning. - ResearchGate, https://www.researchgate.net/publication/221618029_A_Dirty_Model_for_Multi-task_Learning
  20. Self-Paced Multi-Task Learning, https://ojs.aaai.org/index.php/AAAI/article/view/10847/10706
  21. A Dirty Model for Multi-task Learning - Center for Big Data Analytics, https://bigdata.oden.utexas.edu/publication/a-dirty-model-for-multi-task-learning/
  22. Double Q-learning - NIPS, https://papers.nips.cc/paper/3964-double-q-learning
  23. Finite-Time Analysis for Double Q-learning - NIPS, https://papers.nips.cc/paper/2020/file/c20bb2d9a50d5ac1f713f8b34d9aac5a-Paper.pdf
  24. Double Q-learning - NIPS, https://proceedings.neurips.cc/paper/3964-double-q-learning.pdf
  25. (PDF) Double Q-learning. - ResearchGate, https://www.researchgate.net/publication/221619239_Double_Q-learning
  26. Deep Q-Learning, Part2: Double Deep Q Network, (Double DQN) | by Amber | Medium, https://medium.com/@qempsil0914/deep-q-learning-part2-double-deep-q-network-double-dqn-b8fc9212bbb2
  27. A Theory of Multiclass Boosting - NIPS, https://papers.nips.cc/paper/4135-a-theory-of-multiclass-boosting
  28. A Theory of Multiclass Boosting - SciSpace, https://scispace.com/pdf/a-theory-of-multiclass-boosting-2iflohqvfs.pdf
  29. [PDF] A theory of multiclass boosting | Semantic Scholar, https://www.semanticscholar.org/paper/A-theory-of-multiclass-boosting-Mukherjee-Schapire/511a39b793fec36c69c6acc067d3abd3cb2f925f
  30. [1108.2989] A theory of multiclass boosting - arXiv, https://arxiv.org/abs/1108.2989
  31. Tiled convolutional neural networks - NIPS, https://papers.nips.cc/paper/4136-tiled-convolutional-neural-networks
  32. Tiled convolutional neural networks - NIPS, https://proceedings.neurips.cc/paper/4136-tiled-convolutional-neural-networks.pdf
  33. [PDF] Tiled convolutional neural networks - Semantic Scholar, https://www.semanticscholar.org/paper/Tiled-convolutional-neural-networks-Le-Ngiam/05cc38e249a6f642363b5a5cbd71cda67cea5893
  34. Visualization of optimal stimuli and invariances for Tiled Convolutional Neural Networks, https://cs.stanford.edu/~quocle/TCNNweb/index.html
  35. a deep convolutional neural network using heterogeneous pooling - Microsoft, https://www.microsoft.com/en-us/research/wp-content/uploads/2016/02/RevisedFinal-multiPooling-ICASSP2013-LiDongOssama.pdf
  36. The Proceedings of IROS 2010 Workshop on Robots and Musical Expressions (IWRME-2010), http://winnie.kuis.kyoto-u.ac.jp/RMEWS/proc/proc3.pdf
  37. 2010 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS 2010), https://www.semanticscholar.org/paper/2010-IEEE-RSJ-International-Conference-on-Robots-%E5%AD%A6/a0d911fb22c2bb72f1229996bfc292065473518a
  38. 2010 IEEE/RSJ International Conference on Intelligent Robots and Systems, October 18-22, 2010, Taipei, Taiwan - researchr publication, https://researchr.org/publication/iros-2010
  39. Proceedings of the International Conference on Intelligent Robots, https://www.research-collection.ethz.ch/entities/journal/0d2ed1f5-3e2e-4353-9aee-00acdd9df4ef
  40. Efficient Sparse Pose Adjustment for 2D mapping - ResearchGate, https://www.researchgate.net/publication/221066802_Efficient_Sparse_Pose_Adjustment_for_2D_mapping
  41. Efficient Sparse Pose Adjustment for 2D Mapping - Autonome …, http://ais.informatik.uni-freiburg.de/publications/papers/konolige10iros.pdf
  42. [PDF] Efficient Sparse Pose Adjustment for 2D mapping | Semantic Scholar, https://www.semanticscholar.org/paper/Efficient-Sparse-Pose-Adjustment-for-2D-mapping-Konolige-Grisetti/27bb3145c6973e52fbb5f08472c5dc8e11edd026
  43. Efficient Sparse Pose Adjustment for 2D Mapping, http://vigir.missouri.edu/~gdesouza/Research/Conference_CDs/IEEE_IROS_2010/data/papers/0644.pdf
  44. SLAM Toolbox: SLAM for the dynamic world - Open Journals, https://www.theoj.org/joss-papers/joss.02783/10.21105.joss.02783.pdf
  45. A Simultaneous Localization and Mapping (SLAM) Framework for 2.5D Map Building Based on Low-Cost LiDAR and Vision Fusion - MDPI, https://www.mdpi.com/2076-3417/9/10/2105
  46. The History of Robotics in Surgical Specialties - PMC, https://pmc.ncbi.nlm.nih.gov/articles/PMC4677089/
  47. MIT Open Access Articles Modular Robot Systems From Self-Assembly to Self-Disassembly - DSpace@MIT, https://dspace.mit.edu/bitstream/handle/1721.1/69029/Gilpin-2010-Modular%20Robot%20System.pdf?sequence=2
  48. AIIDE 2010 StarCraft Competition - ResearchGate, https://www.researchgate.net/publication/364459165_AIIDE_2010_StarCraft_Competition
  49. (PDF) Artificial Intelligence and Machine Learning Journal, Volume 10, Issue 1, ICGST LLC, Delaware, USA, October 2010 - ResearchGate, https://www.researchgate.net/publication/283348557_Artificial_Intelligence_and_Machine_Learning_Journal_Volume_10_Issue_1_ICGST_LLC_Delaware_USA_October_2010
  50. (PDF) A Knowledge-Based System for Sharing and Reusing Tacit Knowledge in Robotic Manufacturing - ResearchGate, https://www.researchgate.net/publication/220405809_A_Knowledge-Based_System_for_Sharing_and_Reusing_Tacit_Knowledge_in_Robotic_Manufacturing