년 2분기 AI 및 로봇 연구 동향

년 2분기 AI 및 로봇 연구 동향

1. 서론

1.1 년 2분기의 기술적 맥락

2007년 2분기는 인공지능(AI) 및 로보틱스 연구 역사에서 중요한 변곡점으로 기록된다. 이 시기는 첫 아이폰 출시와 함께 스마트폰 혁명이 본격화되고 클라우드 컴퓨팅 인프라가 막 부상하던 때로, 대규모 데이터셋의 수집과 활용 가능성이 점차 현실화되던 기술적 배경을 가지고 있었다. 학문적으로는 서포트 벡터 머신(SVM), 확률적 그래픽 모델 등 통계적 학습에 기반한 고전적 기계 학습 방법론이 이론적, 실용적 정점에 도달해 있었다. 동시에, 훗날 AI 분야의 지형을 완전히 바꿀 심층 학습(Deep Learning)의 전조가 되는 선구적인 연구들이 주요 학회에서 조용히 발표되던 과도기적 특성을 보였다. 이러한 배경 속에서 본 보고서는 당대 연구의 흐름을 심층적으로 분석하고, 그 역사적 의의를 고찰하고자 한다.

1.2 보고서의 분석 범위

본 보고서는 2007년 4월 1일부터 6월 30일까지의 기간을 핵심 분석 대상으로 설정한다. 이 기간 및 직전 시기에 개최된 세계 최고 권위의 학술대회 발표 내용을 중심으로 2분기 연구 지형을 조망한다. 분석 대상이 되는 주요 학술대회는 다음과 같다.

  • 로보틱스 분야: IEEE International Conference on Robotics and Automation (ICRA, 4월) 1
  • 자율 에이전트 분야: International Conference on Autonomous Agents and Multi Agent Systems (AAMAS, 5월) 2
  • 컴퓨터 비전 분야: IEEE Conference on Computer Vision and Pattern Recognition (CVPR, 6월) 4
  • 기계 학습 분야: International Conference on Machine Learning (ICML, 6월) 5

또한, 2분기 연구 동향에 직접적인 영향을 미친 주요 학회로서 3월에 개최된 International Conference on Artificial Intelligence and Statistics (AISTATS)와 ACM/IEEE International Conference on Human-Robot Interaction (HRI)의 핵심 발표 내용도 분석에 포함하여 시기적 연속성과 학문적 영향력을 종합적으로 고찰한다.6

이 학회들은 각 분야에서 가장 엄격한 동료 심사를 거친 최신 연구 성과가 발표되는 장으로, 2007년 당시의 기술 수준과 미래 연구 방향을 가늠할 수 있는 가장 신뢰도 높은 지표이다. 특히 ICRA는 ’유비쿼터스 로보틱스(Ubiquitous Robotics)’를 주제로 로봇 기술의 일상 공간으로의 확장을 모색했으며 1, ICML과 AISTATS에서는 심층 학습의 이론적 토대를 마련한 중요한 논문들이 발표되어 이후 10년의 연구 방향을 예고했다.5

당시 연구 지형을 면밀히 살펴보면, 학계가 중대한 갈림길에 서 있었음을 알 수 있다. 한편으로는 ICML의 최우수 학생 논문상 수상작들이 SVM 최적화(‘LaRank’)나 거리 학습(‘ITML’)과 같이 기존 패러다임을 정교하게 다듬는 데 초점을 맞추고 있었다.9 이는 주류 연구계가 대규모 데이터에 대응하기 위해 잘 정립된 이론을 확장하고 최적화하는 데 막대한 지적 자원을 투입하고 있었음을 보여준다. 다른 한편에서는 AISTATS에서 발표된 Hinton 연구진의 논문들처럼, 비지도 사전학습을 통해 데이터의 계층적 표현을 학습하는 근본적으로 다른 접근법이 등장했다.10 전자가 수학적 우아함과 볼록 최적화(convex optimization)의 안정성을 추구했다면, 후자는 비록 최적화 과정이 복잡하고 이론적으로 완전히 규명되지 않았더라도 데이터 자체의 내재적 구조를 학습하는 데 집중했다. 2007년 2분기는 이처럼 한 시대의 정점과 새로운 시대의 여명이 공존하던 시기였으며, 본 보고서는 이러한 이중적 특성을 심도 있게 분석하여 당시 연구 동향의 미묘하고 다층적인 의미를 전달하고자 한다.

2. 기계 학습 분야의 핵심 연구 동향

2007년 2분기 기계 학습 분야는 기존의 강력한 모델인 SVM의 한계를 극복하려는 노력과, 완전히 새로운 패러다임인 심층 학습의 가능성을 탐색하는 연구가 동시에 진행되는 양상을 보였다. 이는 대규모 데이터 처리라는 시대적 요구에 학계가 두 가지 다른 방식으로 응답하고 있었음을 시사한다.

2.1 대규모 학습 및 최적화 기법의 발전

데이터의 규모가 커짐에 따라 기존 학습 알고리즘의 계산 비용이 심각한 병목으로 작용하기 시작했다. 이에 대응하여, 특히 SVM과 같은 대규모 여백 분류기(large-margin classifier)의 최적화 효율을 높이려는 연구가 활발히 이루어졌다.

2.1.1 ICML 2007 최우수 학생 논문상: LaRank 알고리즘

“Solving MultiClass Support Vector Machines with LaRank” 논문은 자연어 처리에서의 구문 분석(parsing)이나 생물정보학에서의 서열 정렬(sequence alignment)과 같이 출력 공간이 구조화되어 클래스의 수가 기하급수적으로 증가하는 문제에 주목했다.9 이러한 문제에 다중 클래스 SVM을 적용할 경우, 기존의 경사도 기반 최적화 방식은 심각한 비효율성을 드러낸다. 문제의 해(solution) 자체는 희소(sparse)하여 소수의 서포트 벡터만으로 표현되지만, 최적화를 위해 계산해야 하는 경사도(gradient)는 모든 클래스에 대해 조밀(dense)하여 저장 및 계산 비용이 감당할 수 없을 정도로 커지기 때문이다.12

LaRank 알고리즘은 이러한 문제를 퍼셉트론(perceptron) 알고리즘에서 영감을 받은 독창적인 방식으로 해결했다. 전체 경사도를 계산하는 대신, 훈련 데이터를 무작위로 샘플링하고 해당 샘플과 관련된 일부 경사도 정보만을 활용하여 모델을 점진적으로 업데이트하는 확률적 탐색(randomized exploration) 방식을 채택했다.12 이 접근법은 계산 효율성을 극대화하여, 단 한 번의 데이터 전체 통과(single pass)만으로도 최종적으로 수렴된 해와 거의 동등한 수준의 테스트 정확도를 달성하는 놀라운 성과를 보였다.12 이는 대규모 SVM 문제를 온라인 학습 환경에 적용할 수 있는 실용적인 길을 열어준 중요한 기여로 평가된다.

2.1.2 ICML 2007 Test-of-Time 수상 연구: Pegasos 알고리즘

2017년에 ICML 2007의 ‘Test-of-Time’ 상을 수상한 “Pegasos: Primal estimated sub-gradient solver for SVM” 논문은 2007년 당시 SVM 최적화 연구의 중요성을 다시 한번 확인시켜 준다.14 Pegasos는 확률적 준경사도 하강법(stochastic sub-gradient descent)을 SVM의 원 문제(primal problem)에 직접 적용하여, 이론적으로는 데이터 수에 선형적으로 비례하고 실제로는 그보다 더 빠르게 수렴하는 매우 효율적인 알고리즘을 제시했다.

LaRank와 Pegasos 같은 고도로 정교한 최적화 알고리즘의 등장은 커널 머신(kernel machine) 시대의 마지막 전성기를 상징하는 동시에, 그 패러다임의 내재적 한계를 드러내는 현상이기도 했다. 이 알고리즘들은 커널 기반 방법론이 가진 근본적인 확장성 문제를 해결하기 위해 막대한 지적 노력을 투입한 결과물이었다. 바로 이 시점에, 데이터로부터 특징을 직접 학습하고 더 단순한 최적화 기법을 사용하는 심층 학습이라는 대안이 부상할 수 있는 비옥한 토양이 마련되고 있었다.

2.2 비선형 임베딩과 심층 학습의 서막

SVM이 주류를 이루던 시기, Geoffrey Hinton 연구진은 AISTATS 2007에서 이후 딥러닝 혁명을 촉발할 핵심 아이디어를 담은 선구적인 논문들을 발표했다. 이 연구들은 최적화 문제 해결에 집중하기보다, 데이터의 풍부하고 계층적인 표현(representation)을 학습하는 데 중점을 두었다.

2.2.1 “Learning a Nonlinear Embedding by Preserving Class Neighbourhood Structure”

Ruslan Salakhutdinov와 Geoffrey Hinton이 발표한 이 논문은 고차원 입력 데이터를 저차원 특징 공간으로 매핑하는 강력한 비선형 변환 함수를 학습하는 방법을 제시했다.10 이 연구의 핵심은 학습 과정을 두 단계로 나누어, 당시 심층 신경망 훈련의 가장 큰 난제였던 기울기 소실(vanishing gradient) 문제를 효과적으로 해결한 데 있다.

  • 1단계 (비지도 사전학습): 먼저 레이블이 없는 데이터를 사용하여 제한된 볼츠만 머신(Restricted Boltzmann Machine, RBM)을 층별로(layer-wise) 학습시킨다. 이 과정은 데이터의 통계적 구조를 포착하여 신경망의 가중치를 좋은 초기값으로 설정하는 역할을 한다. 이는 무작위 초기화 상태에서 학습을 시작할 때보다 훨씬 더 좋은 지점에서 최적화를 시작하게 해준다.10
  • 2단계 (지도 미세조정): 사전학습으로 초기화된 신경망 전체를 레이블이 있는 데이터를 사용하여 미세조정한다. 이때, K-최근접 이웃(K-Nearest Neighbor, KNN) 분류 성능을 직접적으로 최적화하는 NCA(Neighbourhood Component Analysis) 목적 함수를 사용하여 역전파를 수행한다.10

이러한 2단계 학습 전략을 통해, 이 연구는 MNIST 필기체 숫자 인식 데이터셋에서 당시 최고 성능을 자랑하던 SVM의 오류율을 능가하는 성과를 달성하며, 심층적인 계층적 특징 학습의 잠재력을 명확히 입증했다.10 이는 단순히 ’더 많은 층’을 쌓는 것을 넘어, 방대한 양의 레이블 없는 데이터를 활용하여 유용한 표현을 학습한 뒤, 소량의 레이블 있는 데이터로 특정 과제에 맞게 조정하는 현대적인 전이 학습(transfer learning) 및 자기 지도 학습(self-supervised learning)의 개념적 토대를 마련한 혁신적인 접근법이었다.

2.2.2 “Learning Multilevel Distributed Representations for High-Dimensional Sequences”

Ilya Sutskever와 Geoffrey Hinton은 이 논문에서 순차 데이터(sequential data)를 모델링하기 위한 새로운 심층 생성 모델을 제안했다.11 이 모델은 순환 신경망(RNN)의 시간적 동역학 모델링 능력과 볼츠만 머신의 확률적 표현 학습 능력을 결합한 형태였다. 이를 통해 텍스트나 음성 신호와 같이 시간적 구조를 가진 고차원 데이터의 복잡하고 미묘한 통계적 패턴을 효과적으로 포착할 수 있음을 보여주었다.16 이 연구는 이후 자연어 처리 및 음성 인식 분야에서 심층 학습 기반의 생성 모델이 비약적으로 발전하는 데 중요한 이론적 기반을 제공했다.

2.3 정보 이론 기반 거리 학습

올바른 거리 척도(distance metric)를 선택하는 것은 KNN이나 K-평균 군집화와 같은 알고리즘의 성공에 결정적인 영향을 미친다. 2007년에는 데이터 자체로부터 최적의 거리 척도를 학습하려는 ‘거리 학습(metric learning)’ 연구가 큰 주목을 받았다.

2.3.1 ICML 2007 최우수 학생 논문상: ITML

“Information-Theoretic Metric Learning” (ITML) 논문은 마할라노비스 거리(d_A(x_i, x_j) = (x_i - x_j)^T A (x_i - x_j))를 정의하는 양의 정부호 행렬 A를 학습하는 새로운 정보 이론적 프레임워크를 제시했다.9

이 방법론의 핵심은 거리 학습 문제를 두 다변량 가우시안 분포 간의 쿨백-라이블러 발산(Kullback-Leibler divergence), 즉 상대적 엔트로피를 최소화하는 문제로 정형화한 것이다. 이는 결과적으로 로그-행렬식 발산(LogDet divergence)이라는 특정 브레그만 발산(Bregman divergence)을 선형 제약 조건 하에서 최소화하는 볼록 최적화 문제로 귀결된다.19 학습 문제는 다음과 같이 표현된다.
\min_{A \succ 0} D_{ld}(A, A_0) \quad \text{s.t.} \quad \text{tr}(A(x_i - x_j)(x_i - x_j)^T) \le u, \quad \forall(i,j) \in \mathcal{S}
여기서 D_{ld}(A, A_0) = \text{tr}(A A_0^{-1}) - \log\det(A A_0^{-1}) - dA와 사전 행렬 A_0 사이의 LogDet 발산을 나타내며, \mathcal{S}는 ‘유사해야 하는’ 데이터 쌍의 집합을 의미한다.19

ITML의 가장 큰 기여는 기존의 거리 학습 방법들이 의존했던 계산 비용이 높은 준정부호 프로그래밍(semi-definite programming)이나 고유값 분해 없이도 효율적인 반복 투영(iterative projection) 알고리즘을 통해 해를 구할 수 있다는 점을 보인 것이다.19 이로 인해 대규모 데이터셋에도 적용 가능한 빠르고 확장성 있는 거리 학습이 가능해졌으며, 이는 특징 공간 자체를 과제에 맞게 변형하여 학습 알고리즘의 성능을 향상시키는 연구 흐름을 크게 가속화했다.21

2.4 Table 1: ICML 2007 최우수 학생 논문상 요약

ICML 2007의 최우수 학생 논문상 수상작들은 당시 기계 학습 분야의 핵심 연구 주제들이 무엇이었는지를 명확하게 보여준다. 이는 대규모 최적화, 표현 학습, 스트리밍 데이터 처리, 다중 에이전트 시스템 등 다양하고 중요한 문제들을 젊은 연구자들이 선도적으로 해결하고 있었음을 나타낸다.

논문 제목 (Title)저자 (Authors)핵심 기여 (Core Contribution)관련 Snippet
Solving MultiClass Support Vector Machines with LaRankA. Bordes, L. Bottou, P. Gallinari, J. Weston대규모 다중 클래스 SVM 문제에 대해 전체 경사도를 계산하지 않는 확률적 최적화 알고리즘 제안.9
Information-Theoretic Metric LearningJ. Davis, B. Kulis, P. Jain, S. Sra, I. Dhillon로그-행렬식 발산 최소화를 통해 마할라노비스 거리를 학습하는 빠르고 확장 가능한 정보 이론적 프레임워크 제시.9
Supervised Clustering of Streaming Data for Email Batch DetectionP. Haider, U. Brefeld, T. Scheffer스트리밍 데이터 환경에서 이메일 묶음 검출과 같은 실시간 군집화 문제를 해결하기 위한 지도 학습 기반 군집화 방법론 제안.9
Conditional Random Fields for Multi-agent Reinforcement LearningX. Zhang, D. Aberdeen, S.V.N. Vishwanathan다중 에이전트 강화 학습 문제에서 에이전트 간의 상호작용을 모델링하기 위해 조건부 무작위장(CRF)을 도입.9

3. 컴퓨터 비전 분야의 발전

2007년 CVPR에서는 컴퓨터 비전 기술이 단순한 이미지 분류나 특징점 추출과 같은 개별 문제를 넘어, 복잡하고 동적인 실제 환경을 종합적으로 이해하려는 시도가 두드러졌다. 특히 자율주행과 같은 구체적인 응용을 목표로, 여러 기술을 유기적으로 통합한 시스템 구축 연구가 학계의 가장 큰 주목을 받았다.

3.1 동적 3차원 환경 분석 기술

3.1.1 CVPR 2007 최우수 논문상: “Dynamic 3D Scene Analysis from a Moving Vehicle”

Bastian Leibe 연구진이 발표한 이 논문은 움직이는 차량에서 획득한 스테레오 비디오 스트림만을 이용하여 주변 환경의 동적인 요소들을 실시간으로 분석하고 이해하는 통합 시스템을 제안하여 최우수 논문상을 수상했다.23

이 시스템의 핵심적인 특징은 각기 다른 역할을 수행하는 모듈들이 서로 정보를 주고받으며 전체 시스템의 성능을 향상시키는 ‘협력적 앙상블(collaborative ensemble)’ 구조에 있다.25

  1. 실시간 3D 재구성 (SfM): 먼저, Structure-from-Motion (SfM) 모듈이 스테레오 영상으로부터 카메라의 움직임과 3차원 특징점들의 위치를 실시간으로 추정한다. 이 과정에서 도로의 지면(ground plane) 정보가 지속적으로 갱신된다.25
  2. 객체 검출: SfM 모듈로부터 전달받은 지면 정보는 객체 검출 모듈의 성능을 크게 향상시킨다. 예를 들어, 객체의 예상 크기나 위치를 지면을 기준으로 추론하여 검출의 정확도와 속도를 높인다. 이 모듈은 자동차와 보행자를 포함한 다중 카테고리의 객체를 다양한 시점에서 안정적으로 검출한다.25
  3. 3D 궤적 추정 및 추적: 검출된 2D 객체들은 SfM으로 추정된 카메라 자세 정보를 이용해 3D 월드 좌표계 상의 관측값으로 변환된다. 추적 모듈은 시간에 따라 누적된 이 3D 관측값들을 분석하여 물리적으로 가장 타당한 시공간 궤적(spacetime trajectories)을 찾아낸다. 마지막으로, 객체들 간의 상호작용(예: 충돌 회피)까지 고려하는 전역 최적화(global optimization)를 통해 각 객체의 3D 위치와 이동 경로를 최종적으로 확정한다.25

이 연구는 단순히 여러 기술을 나열한 것이 아니라, 인식, 재구성, 추적이라는 컴퓨터 비전의 핵심 기능들이 어떻게 상호 보완적으로 작동하여 복잡한 실제 문제를 해결할 수 있는지에 대한 구체적인 청사진을 제시했다는 점에서 기념비적인 성과로 평가된다. 이는 오늘날 자율주행 자동차의 환경 인식 시스템 파이프라인의 원형을 제시한 선구적인 연구라 할 수 있다.

3.2 객체 추적 및 검출 기술의 진화

동적 환경 분석의 핵심 요소인 객체 추적 및 검출 기술 또한 한 단계 발전했다.

3.2.1 CVPR 2007 최우수 학생 논문상: “Tracking in Low Frame Rate Video…”

Yuan Li 연구진은 저프레임률 비디오나 객체의 갑작스러운 움직임과 같이 추적이 어려운 조건에 집중했다.23 이러한 상황에서는 프레임 간 시간 간격이 길어 객체의 외형과 위치가 크게 변하므로, 기존의 연속성 가정에 기반한 추적 알고리즘들은 쉽게 실패한다.26

이 논문은 이 문제를 해결하기 위해 ’수명(lifespan)’이 다른 여러 개의 판별적 관찰자(discriminative observers)를 사용하는 독창적인 아이디어를 제안했다.

  • 단기 수명 관찰자: 최근 몇 프레임의 정보만을 사용하여 학습되며, 객체의 급격한 외형 변화에 빠르게 적응하는 역할을 한다.
  • 장기 수명 관찰자: 더 긴 시간 동안의 데이터를 기반으로 학습되어, 객체의 일반적인 외형을 안정적으로 유지하며 추적기가 장기적으로 표류(drift)하는 것을 방지한다.

이러한 다중 관찰자들을 ’캐스케이드 파티클 필터(cascade particle filter)’라는 효율적인 프레임워크로 통합하여, 계산 비용을 최소화하면서도 정확도를 극대화했다.26 이는 추적(tracking)과 검출(detection)을 유기적으로 결합한 접근법의 성공적인 사례로 평가된다.

3.2.2 “Human Detection via Classification on Riemannian Manifolds”

최우수 논문상 후보(Honorable Mention)에 오른 이 연구는 객체 검출을 위한 특징 표현 방식에 새로운 관점을 제시했다.4 기존의 방법들이 이미지 영역을 고정된 길이의 특징 벡터로 변환하여 유클리드 공간에서 분류했던 것과 달리, 이 연구는 이미지 영역을 공분산 행렬(covariance matrix)로 표현했다. 공분산 행렬들의 집합은 유클리드 공간이 아닌 리만 다양체(Riemannian manifold)라는 특수한 기하학적 구조를 형성하는데, 이 연구는 이러한 다양체 상에서 직접 분류를 수행하는 방법을 제안했다. 이는 특징이 가진 내재적 기하 구조를 보존함으로써 더 강력하고 강건한 분류기를 만들 수 있음을 보여주었다.

3.3 시간의 시험을 통과한 연구

10년 후인 2017년, CVPR 2007에서 발표된 논문 중 학계에 가장 지속적이고 심대한 영향을 미친 연구에 수여되는 Longuet-Higgins Prize는 당시 학계가 무엇을 가장 중요하게 여겼는지를 되돌아보게 한다.28

  • “Accurate, Dense, and Robust Multi-View Stereopsis” (Furukawa & Ponce): 이 논문은 여러 장의 사진으로부터 대상의 3차원 형상을 조밀하고(dense) 정확하게 복원하는 알고리즘을 제안했다. 이 연구는 3D 재구성 분야의 핵심적인 기술로 자리 잡으며, 이후 증강현실, 로보틱스, 디지털 문화유산 보존 등 수많은 응용 분야의 기반이 되었다.
  • “Object Retrieval with Large Vocabularies and Fast Spatial Matching” (Philbin et al.): 이 연구는 Bag-of-Features 모델을 기반으로 대규모 이미지 데이터베이스에서 특정 객체나 장소를 빠르고 정확하게 검색하는 방법을 제시했다. 이는 인터넷 규모의 이미지 검색(large-scale image retrieval) 기술 발전에 결정적인 기여를 했다.

2007년 최우수 논문상이 자율주행이라는 특정 ’응용’에 수여된 반면, 10년 후 ‘시간의 시험을 통과한’ 것으로 인정받은 연구들은 세상을 3차원으로 재구성하는 능력과 방대한 시각 데이터 속에서 원하는 정보를 찾아내는 능력이라는, 보다 근본적이고 ‘보편적인’ 기술에 관한 것이었다. 이는 특정 응용 연구가 단기적인 주목을 받을 수는 있지만, 장기적으로 학문 분야 전체를 발전시키는 원동력은 수많은 응용의 기반이 되는 핵심적이고 일반화 가능한 기술이라는 점을 시사한다.

3.4 Table 2: CVPR 2007 주요 수상 논문

CVPR 2007의 주요 수상작들은 컴퓨터 비전 연구가 실세계의 복잡성을 해결하기 위한 통합 시스템과 강건한 알고리즘, 그리고 근본적인 표현 및 검색 기술 개발에 집중하고 있었음을 보여준다.

수상 부문 (Award Category)논문 제목 (Title)저자 (Authors)핵심 기여 (Core Contribution)관련 Snippet
최우수 논문상 (Best Paper)Dynamic 3D Scene Analysis from a Moving VehicleB. Leibe, N. Cornelis, K. Cornelis, L. Van GoolSfM, 객체 검출, 추적을 통합하여 움직이는 차량에서 동적 3D 장면을 실시간으로 분석하는 시스템 제안.23
최우수 학생 논문상 (Best Student Paper)Tracking in Low Frame Rate Video: A Cascade Particle Filter with Discriminative Observers of Different Life SpansY. Li, H. Ai, T. Yamashita, S. Lao서로 다른 수명을 가진 판별적 관찰자들을 캐스케이드 파티클 필터로 결합하여 저프레임률 비디오에서의 객체 추적 성능 향상.23
최우수 논문상 후보 (Honorable Mention)Human Detection via Classification on Riemannian ManifoldsO. Tuzel, F. Porikli, P. Meer공분산 행렬 기술자를 리만 다양체 상에서 직접 분류하여 인간 검출 정확도 향상.4
Longuet-Higgins Prize (2017 수상)Accurate, Dense, and Robust Multi-View StereopsisY. Furukawa, J. Ponce다중 시점 영상으로부터 정확하고 조밀한 3D 모델을 복원하는 선구적인 방법론 제시.28
Longuet-Higgins Prize (2017 수상)Object Retrieval with Large Vocabularies and Fast Spatial MatchingJ. Philbin, O. Chum, M. Isard, J. Sivic, A. Zisserman대규모 이미지 검색을 위한 Bag-of-Features 모델 확장 및 고속 공간 정합 기법 개발.28

4. 로보틱스 및 인간-로봇 상호작용

2007년 로보틱스 분야는 공장 자동화라는 전통적인 영역을 넘어, 로봇이 인간의 일상생활 공간 속으로 들어오는 미래를 준비하고 있었다. 이러한 비전을 실현하기 위한 핵심 과제는 인간과 로봇이 자연스럽게 소통하고 협력하는 기술, 즉 인간-로봇 상호작용(Human-Robot Interaction, HRI)의 발전이었다.

4.1 유비쿼터스 로보틱스와 자동화 과학

4.1.1 ICRA 2007 (로마, 4월)

’유비쿼터스 로보틱스(Ubiquitous Robotics)’를 주제로 내건 ICRA 2007은 로봇이 병원, 가정, 공공장소 등 인간 생활 전반에 걸쳐 편재하며 도움을 주는 미래 사회에 대한 학문적 논의를 촉발했다.1 역대 최다인 1818편의 논문이 제출된 사실은, 이 분야에 대한 전 세계 연구자들의 폭발적인 관심과 기대를 반영한다.1

UC 버클리의 Ken Goldberg 교수는 기조연설에서 ’자동화 과학(science of automation)’이라는 개념을 제시하며 연구계에 중요한 화두를 던졌다.1 그는 자동화 기술이 단순히 정해진 작업을 반복하는 것을 넘어, 부품을 공급하고, 고정하고, 조립하는 일련의 과정에 대한 엄밀한 과학적 방법론이 필요하다고 역설했다. 이는 로봇이 예측 불가능한 일상 환경에서 강건하게 작동하기 위해 필요한 이론적 토대를 마련해야 한다는 주장으로, 유비쿼터스 로보틱스라는 비전을 뒷받침하는 핵심적인 제언이었다.

4.2 사회적 학습 및 상호작용 패러다임

로봇이 인간 사회의 일원이 되기 위해서는 단순히 물리적 작업을 수행하는 능력을 넘어, 인간의 사회적 맥락을 이해하고 그에 맞춰 행동하는 능력이 필수적이다. 2007년 HRI 학회에서는 MIT의 Cynthia Breazeal 연구실을 중심으로 이와 관련된 선구적인 연구들이 다수 발표되었다.7

이 연구들은 로봇과의 상호작용을 단순히 명령을 내리고 수행하는 ’인터페이스’의 관점에서 벗어나, 장기적인 목표를 공유하고 신뢰를 쌓아가는 ’관계’의 관점으로 전환시켰다는 점에서 중요한 의미를 가진다.

  • “Effects of anticipatory action on human-robot teamwork…” (Hoffman & Breazeal): 이 연구는 로봇이 인간 파트너의 다음 행동을 예측하고 미리 필요한 작업을 준비하는 ’선제적 행동(anticipatory action)’이 인간-로봇 팀워크의 효율성과 유창성을 크게 향상시킨다는 것을 실험적으로 증명했다.7 이는 로봇이 수동적인 도구가 아니라 능동적인 협력 파트너가 될 수 있음을 보여준 사례이다.
  • “Robot Learning via Socially Guided Exploration” (Thomaz & Breazeal): 이 연구는 로봇이 인간의 칭찬이나 꾸짖음과 같은 사회적 피드백을 길잡이 삼아 스스로 환경을 탐색하고 새로운 기술을 학습하는 ‘사회적 유도 탐색’ 패러다임을 제안했다.7 특히, 로봇이 긍정적 피드백과 부정적 피드백을 비대칭적으로 해석(예: 칭찬은 특정 행동을 강화하는 데 쓰고, 꾸짖음은 더 넓은 탐색을 유도하는 데 사용)하게 함으로써 보다 효율적인 학습을 가능하게 했다.7
  • “A Robotic Weight Loss Coach” (Kidd & Breazeal): 이 연구는 로봇을 장기적인 건강 관리 파트너로 활용하는 구체적인 응용 사례를 제시했다.7 이는 로봇과의 상호작용이 일회성 과업 수행을 넘어, 신뢰와 사회적 동기 부여에 기반한 장기적인 관계로 발전할 수 있음을 보여주었다.

이러한 연구들은 로봇을 기능적인 기계가 아닌, 인간과 사회적 관계를 맺을 수 있는 지능적 파트너로 만들고자 하는 시도였다. 이는 ICRA 2007이 제시한 ‘유비쿼터스 로보틱스’ 비전을 실현하기 위한 필수적인 전제 조건이며, 이후 10여 년간 HRI 연구의 핵심적인 흐름을 형성했다.

5. 자율 에이전트 및 다중 에이전트 시스템

다수의 자율적인 에이전트들이 상호작용하며 공동의 목표를 달성하는 다중 에이전트 시스템(Multi-Agent Systems, MAS)은 2007년 당시 이론적 발전을 넘어 복잡한 현실 세계 문제에 적용되기 시작했다.

5.1 분산형 항공 교통관제 시스템

5.1.1 AAMAS 2007 최우수 논문상: “Distributed Agent-Based Air Traffic Flow Management”

Kagan Tumer와 Adrian Agogino는 AAMAS 2007에서 최우수 논문상을 수상한 이 연구를 통해, 다중 에이전트 시스템이 어떻게 거대하고 복잡한 사회 기반 시설을 효과적으로 제어할 수 있는지를 실증적으로 보여주었다.2

전통적인 항공 교통관제는 중앙 집중식 시스템에 의해 이루어져 확장성과 유연성에 한계가 있었다. 이 연구는 이러한 문제에 대한 대안으로, 각 항공기 경로를 하나의 자율적인 ’학습 에이전트(learning agent)’가 담당하는 분산형 접근법을 제안했다.

  • 분산 의사결정: 각 에이전트는 주변 항공기와의 충돌을 피하고 자신의 경로를 최적화하기 위해 필요한 분리 간격(separation)을 스스로 학습하고 결정한다. 이들은 시스템 전체의 상태를 알지 못한 채 오직 지역적인 정보만을 바탕으로 행동한다.2
  • 창발적 질서: 놀랍게도, 개별 에이전트들의 이러한 이기적인 행동들이 모여 시스템 전체적으로는 항공 교통 혼잡이 감소하고 흐름이 원활해지는 ’창발적(emergent)’인 긍정적 효과를 만들어낸다.
  • 검증: 연구진은 NASA 에임스 연구센터에서 개발한 고성능 시뮬레이션 도구인 FACET(Future Air Traffic Management Concepts Evaluation Tool)을 활용하여 제안된 시스템의 효율성과 신뢰성을 입증했다.2

이 연구는 중앙의 통제 없이도 다수의 자율적 주체들이 협력하여 복잡한 시스템을 안정적으로 운영할 수 있다는 가능성을 보여준 중요한 사례이다. 이는 이후 스마트 그리드에서의 전력 분배, 군집 로봇 제어, 자율 물류 네트워크 최적화 등 다양한 분산 시스템 연구에 큰 영감을 주었다.

6. 결론 및 2007년 2분기 연구의 의의

6.1 종합 및 요약

2007년 2분기는 인공지능 및 로보틱스 분야가 중대한 전환기를 맞이하고 있었음을 명확히 보여주는 시기였다. 한편에서는 SVM과 같은 통계적 기계 학습 모델이 정교한 최적화 이론을 통해 그 성능의 정점을 향해 나아가고 있었고, 다른 한편에서는 데이터로부터 직접 계층적 특징을 학습하는 심층 신경망이라는 새로운 패러다임이 그 무한한 잠재력을 드러내기 시작했다. 컴퓨터 비전과 로보틱스 분야는 더 이상 통제된 실험실 환경에 머무르지 않고, 자율주행 차량, 사회적 로봇과 같이 실세계의 동적이고 불확실한 환경에 직접 도전하는 통합 시스템 연구로 대담하게 나아갔다.

6.2 핵심 트렌드 분석

본 보고서에서 분석한 2007년 2분기의 연구들을 통해 다음과 같은 세 가지 핵심적인 흐름을 확인할 수 있었다.

  1. 패러다임의 전환 (Paradigm Shift): 기계 학습 분야는 수학적으로 잘 정의된 볼록 최적화(convex optimization) 문제 해결에 집중하던 SVM 중심의 패러다임과, 데이터의 복잡한 내재적 구조를 학습하는 비볼록(non-convex) 최적화 기반의 심층 학습 전조 현상 사이의 지적 긴장과 공존이 뚜렷했다. 이는 문제 해결의 초점이 ’정교한 모델 최적화’에서 ’효과적인 표현 학습’으로 이동하기 시작했음을 의미한다.
  2. 실세계로의 확장 (Expansion to the Real World): 연구의 무대가 이상적인 데이터셋에서 벗어나 ‘움직이는 차량에서’, ‘저프레임률 비디오에서’, ’인간과의 상호작용 속에서’와 같이 현실 세계의 다양한 제약 조건 하에서 강건하게(robust) 작동하는 시스템을 구축하는 방향으로 급격히 이동했다. 이는 AI 기술의 실용화와 산업적 응용에 대한 기대가 커지고 있었음을 반영한다.
  3. 시스템 통합 (System Integration): 단일 알고리즘의 성능을 소수점 단위로 개선하는 경쟁을 넘어, 인식(Perception), 계획(Planning), 행동(Action) 등 여러 이질적인 모듈을 하나의 목표를 위해 유기적으로 결합하는 통합 시스템 구축이 중요한 연구 주제로 부상했다. 이는 개별 기술의 성숙도가 일정 수준에 도달함에 따라, 이들을 융합하여 더 크고 복잡한 문제를 해결하려는 시도가 본격화되었음을 보여준다.

6.3 장기적 영향 평가

2007년 2분기에 발표된 연구들은 이후 10년간 AI 기술 발전의 경로를 설정하는 데 결정적인 역할을 수행했다. AISTATS에서 발표된 Hinton 연구진의 비지도 사전학습 연구는 2012년 AlexNet의 등장과 함께 폭발한 심층 학습 혁명의 핵심적인 이론적 자양분이 되었다. CVPR에서 발표된 Leibe 연구진의 동적 장면 분석 시스템은 오늘날 수많은 자율주행차에 탑재된 환경 인식 기술의 직접적인 초석을 다졌다. HRI 분야의 연구들은 인공지능 스피커, 교육용 로봇, 노인 돌봄 로봇 등 인간과 교감하고 관계를 맺는 현대 AI 서비스의 철학적, 기술적 기반을 제공했다.

결론적으로, 2007년 2분기는 인공지능이 순수한 이론적 탐구를 넘어, 복잡한 세상과 직접 상호작용하고 인간 사회의 일부가 되려는 ’지능’으로 거듭나기 시작한, 역사적으로 매우 중요한 순간으로 기록될 것이다. 이 시기에 뿌려진 씨앗들은 10여 년의 시간을 거쳐 현재 우리가 경험하고 있는 AI 시대의 거대한 숲을 이루었다.

7. 참고 자료

  1. 2007 IEEE International Conference on Robotics and Automation - Open Research Repository, https://openresearch-repository.anu.edu.au/bitstreams/8d3f1c81-7efa-4c64-9300-931ce0864fd8/download
  2. UARC researcher wins best paper award at AAMAS conference …, https://news.ucsc.edu/2007/06/uarc-researcher-wins-best-paper-award-at-aamas-conference/
  3. AAMAS 2007 Introduction - IFAAMAS, https://www.ifaamas.org/Proceedings/aamas07/html/intro.html
  4. AWARD - CVPR 2007 Best Paper Runner Up of 1300 submitted - News & Events | Mitsubishi Electric Research Laboratories, https://www.merl.com/news/award-20070101-18
  5. 2007 International Conference on Machine Learning, https://icml.cc/Conferences/2007/
  6. Proceedings of Machine Learning Research | Proceedings of the …, https://proceedings.mlr.press/v2/
  7. Conferences - MIT Media Lab, https://web.media.mit.edu/~cynthiab/publications/p/pp/conf/conf.html
  8. Proceedings of the ACM/IEEE International Conference on Human-Robot Interaction | IxDF, https://www.interaction-design.org/literature/conference/proceedings-of-the-acm-ieee-international-conference-on-human-robot-interaction
  9. 2007 ICML: Winners of the Best Student Paper Awards, https://icml.cc/Conferences/2007/beststudentpapers.html
  10. Learning a Nonlinear Embedding by Preserving Class …, https://proceedings.mlr.press/v2/salakhutdinov07a.html
  11. A Survey of Deep Network Techniques All Classifiers Can Adopt - PMC, https://pmc.ncbi.nlm.nih.gov/articles/PMC8475790/
  12. papers:bordes-2007 [leon.bottou.org], https://leon.bottou.org/papers/bordes-2007
  13. Solving multiclass support vector machines with LaRank - ResearchGate, https://www.researchgate.net/publication/221345222_Solving_multiclass_support_vector_machines_with_LaRank
  14. Award-winning classic papers in ML and NLP - Desh Raj, https://desh2608.github.io/2018-08-30-classic-papers/
  15. by Ilya Sutskever A thesis submitted in conformity with the requirements for the degree of Doctor of Philosophy Graduate Departm, https://www.cs.utoronto.ca/~ilya/pubs/ilya_sutskever_phd_thesis.pdf
  16. (PDF) A review on generative Boltzmann networks applied to dynamic systems, https://www.researchgate.net/publication/342848281_A_review_on_generative_Boltzmann_networks_applied_to_dynamic_systems
  17. Learning to Estimate Dynamical State with Probabilistic Population Codes - PMC, https://pmc.ncbi.nlm.nih.gov/articles/PMC4634970/
  18. Deep Neural Models for Generalized Synthesis of Multi-Person Actions - CVIT, IIIT, http://cvit.iiit.ac.in/images/Thesis/MS/2023/Thesis_Debtanu_updated.pdf
  19. Information-Theoretic Metric Learning - CiteSeerX, https://www.cs.utexas.edu/~inderjit/public_papers/itml_icml07.pdf
  20. Information-theoretic metric learning | Request PDF - ResearchGate, https://www.researchgate.net/publication/221345438_Information-theoretic_metric_learning
  21. Fast Solvers and Efficient Implementations for Distance Metric Learning, https://icml.cc/Conferences/2008/papers/215.pdf
  22. Geometry-aware Metric Learning, https://icml.cc/Conferences/2009/papers/193.pdf
  23. CVPR Paper Awards - IEEE Computer Society Technical Committee on Pattern Analysis and Machine Intelligence, https://tc.computer.org/tcpami/awards/cvpr-paper-awards/
  24. 1월 1, 1970에 액세스, https://www.researchgate.net/publication/221213586_Dynamic_3D_Scene_Analysis_from_a_Moving_Vehicle
  25. (PDF) Dynamic 3D Scene Analysis from a Moving Vehicle, https://www.researchgate.net/publication/221362530_Dynamic_3D_Scene_Analysis_from_a_Moving_Vehicle
  26. (PDF) Tracking in Low Frame Rate Video: A Cascade Particle Filter …, https://www.researchgate.net/publication/221363361_Tracking_in_Low_Frame_Rate_Video_A_Cascade_Particle_Filter_with_Discriminative_Observers_of_Different_Lifespans
  27. Haizhou AI-Department of Computer Science and Technology, Tsinghua University, https://www.cs.tsinghua.edu.cn/csen/info/1154/3899.htm
  28. SarahRastegar/Best-Papers-Top-Venues - GitHub, https://github.com/SarahRastegar/Best-Papers-Top-Venues