년 3분기 AI 및 로봇 연구 동향
1. 서론: 2011년, 지능의 패러다임이 변화하던 시기
2011년은 인공지능(AI) 및 로봇공학 분야의 기술사에서 중요한 변곡점으로 기록된다. 이 시기는 2012년 AlexNet이 촉발한 딥러닝 혁명 직전, 전통적인 기계 학습, 지식 표현, 추론, 계획 등의 패러다임이 최고조에 달했던 정점의 시기였다. 특히 2011년 2월, IBM의 Watson이 미국의 유명 퀴즈쇼 Jeopardy!에서 인간 챔피언들을 상대로 압도적인 승리를 거둔 사건은 학계와 산업계에 큰 반향을 일으켰다.1 이는 AI가 고도로 통제된 환경을 넘어, 방대한 비정형 자연어 데이터를 이해하고 복잡한 질의에 답할 수 있는 실용적 가능성을 입증한 상징적인 성과였다.
본 보고서는 바로 이 시점, 즉 전통 AI의 정점과 새로운 패러다임의 여명이 교차하던 2011년 3분기(7월-9월)의 핵심 연구 동향을 심층적으로 분석하는 것을 목적으로 한다. 이를 위해 해당 기간에 개최된 세계 최고 수준의 학술대회인 IJCAI, AAAI, IROS에서 발표된 최우수 논문들을 중심으로, 당시 학계를 관통하던 핵심 연구 주제와 기술적 성취를 분석하고 그 기술사적 의의를 고찰한다. 이 시기에는 이탈리아 인공지능학회(AI*IA)와 같은 활발한 지역 학회도 개최되어 연구의 폭넓은 저변을 확인할 수 있었다.3
해당 분기에 개최된 3대 주요 학술대회는 각각 뚜렷한 정체성을 바탕으로 당시 연구 지형의 다각적인 측면을 조망하는 창을 제공한다. 표 1은 본 보고서에서 중점적으로 다룰 학술대회의 개요를 요약한 것이다.
표 1: 2011년 3분기 주요 AI 및 로봇공학 학술대회
| 학회명 | 기간 | 장소 | 주요 특징 |
|---|---|---|---|
| International Joint Conference on Artificial Intelligence (IJCAI-11) | 2011년 7월 16-22일 | 스페인 바르셀로나 | AI 기초 이론 및 탐색, 추론, 사회적 선택의 계산적 한계 탐구 |
| AAAI Conference on Artificial Intelligence (AAAI-11) | 2011년 8월 7-11일 | 미국 샌프란시스코 | AI 이론과 더불어 Watson과 같은 혁신적 응용 사례 조명 |
| IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS 2011) | 2011년 9월 25-30일 | 미국 샌프란시스코 | 지능형 로봇 시스템의 지각, 계획, 상호작용 등 자율성 기술 고도화 |
| International Conference of the Italian Association for Artificial Intelligence (AI*IA 2011) | 2011년 9월 15-17일 | 이탈리아 팔레르모 | 유럽 중심의 AI 연구 커뮤니티 허브 역할 수행 |
이 학회들의 발표 내용을 통해, 2011년 3분기는 AI의 이론적 기반을 더욱 공고히 다지는 동시에, 그 기술을 현실 세계의 복잡하고 중요한 문제에 적용하려는 노력이 본격화된 시기였음을 확인할 수 있다.
2. 제22회 국제인공지능학회 (IJCAI-11): 이론적 토대의 심화
2.1 학회 동향: 계산의 근본적 한계에 대한 탐구
제22회 국제인공지능학회(IJCAI-11)는 스페인 바르셀로나에서 개최되었으며, AI의 핵심 분야인 탐색, 추론, 다중에이전트 시스템 등에서 계산적 복잡성(computational complexity)과 결정 가능성(decidability)이라는 근본적인 문제에 천착하는 연구들이 두각을 나타냈다.4 이는 AI 기술의 응용이 무분별하게 확장되기 전에 그 이론적 기반을 더욱 공고히 하려는 학문적 성숙도를 반영하는 현상이었다. 특히, 다중에이전트 시스템이 개별 에이전트의 합리성을 넘어 집단의 합리성과 상호작용의 복잡성을 다루는 방향으로 심화됨에 따라, ’사회적 선택(Social Choice)과 AI’를 주제로 한 워크숍이 활발히 진행된 점은 주목할 만하다.6 이는 AI가 기술적 문제를 넘어 사회적, 경제적 합의 도출 과정의 본질을 탐구하기 시작했음을 시사한다.
2.2 주요 수상 및 강연 분석
IJCAI-11의 주요 수상 내역은 당시 학회가 어떤 가치를 중요하게 여겼는지를 명확히 보여준다.
-
연구 우수성상 (Award for Research Excellence): 논리 프로그래밍과 자동 정리 증명(automated theorem proving) 분야의 선구자인 로버트 코왈스키(Robert Anthony Kowalski) 교수가 수상했다.8 이는 AI 분야에서 기호적 접근과 논리적 기반의 중요성이 여전히 학문적 핵심 가치로 인정받고 있음을 보여주는 상징적인 결정이었다.
-
컴퓨터와 사고상 (Computers and Thought Award): 이 상은 AI 분야의 젊은 과학자에게 수여되는 최고 영예로, 빈센트 코니처(Vincent Conitzer)와 말테 헬메르트(Malte Helmert)가 공동 수상했다.8 코니처는 게임 이론, 사회적 선택 등 미시경제학과 AI의 경계에서 계산적 측면을 분석한 공로를, 헬메르트는 자동화된 계획(automated planning) 및 조합 탐색(combinatorial search) 분야의 이론과 실제에 기여한 공로를 인정받았다. 이 두 수상자의 연구 분야는 각각 다중에이전트 시스템의 전략적 상호작용과 단일 에이전트의 효율적 문제 해결 능력이라는 AI 연구의 양대 축을 대표하며, IJCAI가 이 두 분야의 균형 있는 발전을 중시하고 있음을 시사한다.
2.3 우수 논문 심층 분석
IJCAI-11에서 우수 논문(Distinguished Paper)으로 선정된 연구들은 모두 각 분야의 이론적 깊이를 한 단계 끌어올린 중요한 성과들이다. 이 논문들은 단순히 기존 방법의 성능을 개선하는 것을 넘어, 문제의 근본적인 구조와 한계를 파헤쳤다는 공통점을 가진다.
2.3.1 탐색의 진화: Nested Rollout Policy Adaptation for Monte Carlo Tree Search
몬테카를로 트리 탐색(Monte Carlo Tree Search, MCTS)은 2000년대 중반 이후 게임 AI 분야에서 혁신을 일으킨 핵심 알고리즘이었다. MCTS는 무작위 시뮬레이션, 즉 ’롤아웃(rollout)’을 통해 탐색 트리의 각 노드의 가치를 평가한다. 그러나 롤아웃이 완전히 무작위적이거나 고정된 정책에 의존할 경우, 탐색 효율이 저하되는 문제가 있었다.10
-
연구 목표: Christopher D. Rosin이 발표한 이 논문은 MCTS의 핵심 요소인 롤아웃 정책을 탐색 과정 중에 동적으로 적응시켜 탐색 효율을 극대화하는 새로운 알고리즘, NRPA(Nested Rollout Policy Adaptation)를 제안했다.10
-
방법론: NRPA는 기존의 중첩 몬테카를로 탐색(NMCS)의 재귀적 구조를 기반으로 한다.11 하지만 각 중첩 레벨에서 단순히 최상의 경로를 기억하는 데 그치지 않고, 현재까지 발견된 최적의 해(solution sequence)를 향해 롤아웃 정책을 경사 상승법(gradient ascent)으로 점진적으로 업데이트한다. 정책
pol이 주어졌을 때, 최적의 시퀀스seq를 향해 정책을 조정하는Adapt함수는 다음과 같이 표현될 수 있다. 각 단계(ply)에서 선택된 행동seq[ply]의 가중치는Alpha만큼 증가시키고, 다른 모든 가능한 행동i의 가중치는 그 행동이 선택될 확률에 비례하여 감소시킨다.13
Adapt(pol, seq)
node <- root
pol' <- pol
for ply <- 0 to length(seq)-1 do
pol'[code(node, seq[ply])] += Alpha
z <- SUM exp(pol[code(node, i)]) over node's children i
for children i of node do
pol'[code(node, i)] -= Alpha * exp(pol[code(node, i)]) / z
end for
node <- child(node, seq[ply])
end for
return pol'
이 과정은 탐색이 진행될수록 유망한 영역으로 시뮬레이션을 집중시켜, 더 빠르고 깊게 최적해를 찾아가도록 유도한다.
-
주요 결과: NRPA는 십자말풀이 생성, 모피온 솔리테어와 같은 어려운 조합 최적화 문제에서 기존 NMCS를 포함한 다른 최신 알고리즘들을 압도하는 성능을 보였으며, 특히 모피온 솔리테어에서는 세계 신기록을 경신하는 성과를 거두었다.12
-
학술적 의의: 이 연구는 MCTS의 성능이 롤아웃 정책에 크게 의존한다는 점에 착안하여, 온라인 학습을 통해 정책 자체를 최적화하는 새로운 패러다임을 제시했다.8 이는 탐색 문제와 강화학습의 정책 개선 아이디어를 결합한 선구적인 시도로, 몇 년 후 등장한 알파고(AlphaGo)가 정책망(policy network)을 활용하여 MCTS의 성능을 극적으로 향상시킨 아이디어와 그 맥을 같이한다. 즉, NRPA는 순수한 탐색 알고리즘에 학습의 개념을 깊이 통합한 중요한 이정표로 평가할 수 있다.
2.3.2 공간 추론의 한계: On the Decidability of Connectedness Constraints in 2D and 3D Euclidean Spaces
질적 공간 추론(Qualitative Spatial Reasoning, QSR)은 AI의 지식 표현 및 추론 분야에서 물리적 세계의 공간 관계를 기호적으로 다루는 중요한 연구 분야이다. 이 분야의 핵심 질문 중 하나는, 주어진 공간 제약 조건들의 집합이 기하학적으로 실현 가능한지를 판단하는 만족성(satisfiability) 문제이다.14
-
연구 목표: Roman Kontchakov 연구팀은 QSR에서 가장 기본적인 제약 조건 중 하나인 ’연결성(connectedness)’이 포함된 공간 논리의 만족성 문제가 2차원 및 3차원 유클리드 공간에서 결정 가능한지(decidable), 만약 그렇다면 그 계산 복잡성이 어느 정도인지를 규명하고자 했다.15
-
방법론: 연구팀은 영역 간의 위상 관계를 다루는 기존의 RCC8과 같은 공간 논리를 확장하여, 영역이 ’한 덩어리’인지를 나타내는 연결성 술어(
c)와 영역의 내부가 연결되었는지를 나타내는 내부-연결성 술어(c°)를 추가한 새로운 언어(Bc,Cc등)를 정의했다.14 이후, 튜링 기계의 계산 과정을 공간적 영역들의 배열과 접촉 관계로 인코딩하는 정교한 기법을 사용하여, 이들 언어의 만족성 문제가 2차원 평면에서는 사실상 튜링 기계의 정지 문제와 동등하며, 따라서 결정 불가능(undecidable)함을 증명했다.14 -
주요 결과: 이 연구는 충격적인 결과를 제시했다. 2차원 유클리드 공간에서는 연결성 제약이 포함된 공간 추론이 결정 불가능하다는 것이다. 반면, 3차원 공간에서는 영역을 어떻게 정의하느냐(일반적인 정규 닫힌 집합 vs. 다면체)에 따라 복잡성이 NP-complete에서 EXPTIME-complete로 극적으로 변함을 보였다.14 이는 추론의 복잡성이 공간의 차원과 고려되는 객체의 종류에 매우 민감하게 반응함을 의미한다.
-
학술적 의의: 이 논문은 QSR 분야의 근본적인 계산적 한계를 명확히 밝혔다.8 특히 2D에서의 결정 불가능성 증명은, 직관적으로는 단순해 보이는 ’연결성’이라는 속성이 논리 시스템에 추가될 때 얼마나 다루기 힘들어지는지를 보여주는 중요한 이론적 성과였다. 이는 향후 실용적인 공간 추론 시스템을 설계할 때 표현력과 계산 가능성 사이의 트레이드오프를 어떻게 설정해야 하는지에 대한 중요한 지침을 제공했으며, 유클리드 공간의 고유한 위상적 특성이 추론의 복잡성에 미치는 영향을 깊이 이해하게 만들었다.14
2.3.3 사회적 선택의 복잡성: Unweighted Coalitional Manipulation under the Borda Rule Is NP-Hard
계산 사회 선택(Computational Social Choice)은 사회적 의사결정 과정을 계산적 관점에서 분석하는 AI의 한 분야이다. 이 분야의 핵심 주제 중 하나는 선거 조작(election manipulation)의 계산 복잡성이다. 만약 특정 투표 규칙 하에서 승자를 조작하는 방법을 찾는 것이 계산적으로 매우 어렵다면(NP-난해), 그 계산적 어려움 자체가 조작에 대한 방어벽 역할을 할 수 있다는 아이디어에 기반한다.19
-
연구 목표: Nadja Betzler 연구팀은 계산 사회 선택 분야의 오랜 미해결 문제였던, 보르다(Borda) 투표 규칙 하에서 가중치가 없는(unweighted) 투표자들이 연합하여 선거 결과를 조작하는 것이 계산적으로 얼마나 어려운지를 증명하는 것을 목표로 삼았다.20
-
방법론: 연구팀은 스케줄링 이론의 NP-난해 문제인 ‘2-Numerical Matching with Target Sums’ 문제를 보르다 규칙 조작 문제로 다항 시간에 환원(reduction)하는 정교한 증명을 구성했다.19 이 환원은 단 2명의 조작자와 3개의 비조작 투표만으로도 조작 방법을 찾는 것이 NP-난해해짐을 보여준다.20
-
주요 결과: 보르다 규칙 하의 비가중 연합 조작 문제가 NP-난해(NP-hard)임을 최종적으로 증명했다.8 이는 보르다 규칙이 계산 복잡성 관점에서는 조작에 대해 잠재적으로 강건할 수 있음을 이론적으로 뒷받침하는 결과이다.
-
학술적 의의: 이 연구는 주요 투표 규칙 중 거의 마지막으로 남아있던 미해결 문제의 복잡성을 규명함으로써 계산 사회 선택 분야의 지도를 완성하는 데 크게 기여했다.20 이 결과는 이후 조작, 뇌물, 통제 등 다양한 선거 관련 문제들의 계산 복잡성 연구에 중요한 기준점이 되었으며, AI가 어떻게 사회 시스템의 공정성과 안정성을 분석하는 데 기여할 수 있는지를 보여주는 대표적인 사례가 되었다.22
이 세 편의 우수 논문은 2011년 AI 연구가 단순히 ‘더 잘하는’ 것을 넘어, ‘무엇을 할 수 있고 무엇을 할 수 없는지’, 그리고 ’얼마나 어렵게 할 수 있는지’에 대한 근본적인 이해를 추구할 만큼 성숙했다는 증거이다. 이는 응용 기술의 폭발적 성장 이전에 반드시 필요한 이론적 토대를 다지는 과정으로 해석할 수 있으며, AI가 최적화 이론, 위상 수학, 경제학 등 다른 학문 분야와 깊이 융합하며 발전하고 있음을 보여준다.
3. 제25회 인공지능학회 (AAAI-11): 현실 문제 해결을 향한 AI의 확장
3.1 학회 동향: AI, 실험실을 넘어 세상으로
제25회 인공지능학회(AAAI-11)는 IBM Watson의 Jeopardy! 우승의 여운이 채 가시지 않은 가운데 미국 샌프란시스코에서 개최되었다.1 이 사건은 대규모 데이터 처리, 자연어 이해, 지식 표현, 검색 기술이 통합된 ‘DeepQA’ 아키텍처의 성공이었으며, AI가 특정 게임을 넘어 인간 고유의 영역이라 여겨졌던 복잡한 지식 기반 질의응답에서 실질적인 성과를 낼 수 있음을 입증했다. 이러한 분위기 속에서 AAAI-11은 AI의 이론적 탐구를 넘어 환경, 에너지, 사회 문제 등 현실 세계의 복잡하고 중요한 문제 해결로 그 관심이 확장되고 있음을 명확히 보여주었다. 특히 ‘계산 지속가능성(Computational Sustainability)’ 분야가 주요 트랙으로 자리 잡고 최우수 논문까지 배출한 것은 이러한 흐름을 상징적으로 보여주는 사건이었다.24
3.2 주요 기조연설 분석: 데이비드 페루치(David Ferrucci)의 Watson
IBM T.J. Watson 연구소의 데이비드 페루치는 Watson 프로젝트의 책임자로서 기조연설을 맡아 학계의 큰 주목을 받았다.1 그의 발표는 Watson이 어떻게 방대한 비정형 자연어 텍스트로부터 수많은 증거를 수집하고, 이를 바탕으로 가능한 가설들을 생성하며, 각 가설의 신뢰도를 정량적으로 평가하여 최종 답을 도출하는지에 대한 DeepQA 아키텍처의 핵심 원리를 설명했다. 이는 단일 알고리즘의 우수성이 아니라, 자연어 처리, 정보 검색, 기계 학습, 지식 표현 등 다양한 AI 기술 요소들을 정교하게 통합하고 엔지니어링하는 ’시스템적 접근’의 중요성을 학계에 각인시키는 계기가 되었다. Watson의 성공은 AI 연구가 이론적 모델을 넘어, 실제 세계의 대규모 데이터를 다루는 강력하고 확장 가능한 시스템을 구축하는 방향으로 나아가야 함을 역설했다.
3.3 최우수 논문 심층 분석
AAAI-11의 최우수 논문(Outstanding Paper)들은 이러한 시대적 배경을 반영하여, 이론적 깊이와 현실적 영향력을 동시에 갖춘 연구들이 선정되었다.
3.3.1 알고리즘 게임 이론: Complexity of and Algorithms for Borda Manipulation
IJCAI-11에서와 마찬가지로 AAAI-11에서도 보르다 규칙 조작 문제가 최우수 논문으로 선정된 것은 이 주제가 당시 AI 커뮤니티의 최대 화두 중 하나였음을 보여준다. 두 학회에서 거의 동시에 독립적인 연구팀이 같은 난제를 해결한 것은, 2000년대 후반부터 폭발적으로 성장한 계산 사회 선택 분야 내에서 ‘비가중 연합 조작’ 문제가 학문적 성취의 정점으로 여겨지고 있었음을 의미한다.
-
연구 목표: Jessica Davies 연구팀의 이 논문은 IJCAI-11 논문과 마찬가지로 보르다 규칙 조작의 복잡성을 규명하는 것을 목표로 하되, NP-난해성 증명을 넘어 실제 조작을 계산하기 위한 알고리즘적 접근법을 함께 탐구했다.24
-
방법론 및 결과: 이 논문 역시 보르다 조작이 NP-난해함을 증명했으며, 추가적으로 이 문제를 해결하기 위한 실용적인 알고리즘을 제시했다. 예를 들어, 조작 문제를 정수 선형 계획법(Integer Linear Programming)이나 제약 만족 문제(Constraint Satisfaction Problem)로 정형화하고, 이를 해결하는 솔버를 사용하여 최적의 조작 투표를 찾아내는 접근 방식을 취했을 것으로 보인다.
-
학술적 의의: 이 연구는 문제의 이론적 경계(NP-hardness)를 밝히는 것과 동시에, 그 문제를 실제로 해결하려는 실용적 시도(알고리즘)를 결합했다는 점에서 중요하다. 이는 이론적 복잡성이 반드시 실제적 불가능성을 의미하지는 않으며, 효과적인 알고리즘을 통해 특정 조건 하에서는 어려운 문제도 해결할 수 있다는 가능성을 탐색했다는 점에서 의의가 있다. 두 최상위 학회가 동시에 이 주제를 인정한 것은, 이 문제 해결이 단순한 기술적 성취를 넘어 AI 분야의 중요한 지적 돌파구로 평가받았음을 보여준다.
3.3.2 계산 지속가능성: Dynamic Resource Allocation in Conservation Planning
이 논문은 AI 기술이 어떻게 인류가 직면한 중대한 환경 문제 해결에 직접적으로 기여할 수 있는지를 보여준 대표적인 사례이다.
-
연구 목표: Daniel Golovin 연구팀은 멸종 위기종 보호를 위해 어느 토지를 언제 매입할지 결정하는 것과 같은 동적 자원 할당 문제를 다루었다. 이 문제는 예산과 토지 가용성이 시간에 따라 변하는 불확실성 하에서 최적의 순차적 의사결정을 내려야 하는 매우 복잡한 문제이다.27
-
방법론: 연구팀은 이 문제가 ’적응적 부모듈성(adaptive submodularity)’이라는 수학적 특성을 가짐을 발견했다. 부모듈성(submodularity)은 집합에 원소를 추가할 때 얻는 한계 이익이 점차 감소하는 ’규모의 경제’와 유사한 속성이다. 연구팀은 이 특성을 활용하여, 각 의사결정 시점에서 단기적인 기대 이익이 가장 큰 선택을 하는 단순한 ‘탐욕(greedy)’ 알고리즘이 이론적으로 최적 정책에 근접하는 성능(near-optimal performance)을 보장함을 증명했다.29 이 이론적 결과를 미국 북서부 태평양 연안의 세 희귀종(나비, 도마뱀, 땅다람쥐) 보존 계획이라는 실제 사례 연구에 적용하여 그 유효성을 검증했다.29
-
주요 결과: 복잡하고 불확실성이 높은 실제 환경 보전 계획 문제에 대해, 계산적으로 매우 효율적이면서도 이론적으로 성능이 보장되는 강력한 의사결정 알고리즘을 제시했다.27
-
학술적 의의: 이 연구는 AI의 핵심 이론 중 하나인 부모듈성 최적화가 어떻게 복잡한 현실 세계의 지속가능성 문제에 직접적으로 기여할 수 있는지를 명확히 보여주었다.24 이는 AI 연구가 사회적 영향력을 가질 수 있음을 입증하며, 이후 ‘AI for Social Good’ 또는 ‘AI for Social Impact’ 분야가 성장하는 데 중요한 이정표 역할을 했다.26
AAAI-11은 AI 응용이 나아갈 두 가지 중요한 방향, 즉 산업적 파급력과 사회적 기여를 동시에 조명했다. IBM Watson에 대한 기조연설이 거대 기업 주도의 산업 AI의 미래를 예고했다면, 보전 계획에 관한 최우수 논문은 학계와 비영리 단체 중심의 사회적 영향력을 추구하는 AI 연구의 가능성을 보여주었다. AAAI-11은 이 두 흐름이 본격적으로 수면 위로 드러난 상징적인 행사로 기록될 수 있다.
4. IEEE/RSJ 국제 지능형 로봇 및 시스템 학회 (IROS 2011): 자율 로봇 기술의 고도화
4.1 학회 동향: 현실 세계와의 상호작용을 위한 지능
로봇공학 50주년을 기념하며 미국 샌프란시스코에서 열린 IROS 2011은 로봇 기술의 과거를 성찰하고 미래를 조망하는 의미 있는 행사였다.31 2,459편의 방대한 논문이 제출되고 그중 32%인 790편이 채택된 이 대규모 학회는, 로봇이 통제된 공장 환경을 벗어나 불확실하고 동적인 실제 환경에서 성공적으로 임무를 수행하기 위해 필요한 핵심 기술들에 연구 역량이 집중되고 있음을 보여주었다.33 특히 인간-로봇 상호작용(HRI), 의료 로봇, 지능형 교통 시스템과 같은 응용 분야가 특별 포럼으로 다뤄진 것은, 로봇 기술이 점차 사회와 긴밀하게 상호작용하며 그 영향력을 확대하고 있음을 반영한다.32
4.2 특별 심포지엄 분석: 토마스 로자노-페레즈(Tomas Lozano-Perez)의 동작 계획
동작 계획(Motion Planning) 분야의 세계적인 개척자인 MIT의 토마스 로자노-페레즈 교수는 ’동작 계획: 목표와 정보’라는 주제로 특별 심포지엄의 기조연설을 맡았다.35 그는 고전적인 동작 계획이 ’완벽하게 알려진 환경’에서 ’단일 목표’를 달성하는 데 초점을 맞췄지만, ’집 청소’와 같은 실제 로봇 과제는 ‘엄청난 불확실성’ 속에서 ’수천 개의 연속적인 동작 계획 목표’를 다뤄야 한다고 지적했다. 이는 2011년 로봇공학계가 직면한 핵심 과제, 즉 아름다운 이론과 복잡한 현실 사이의 간극을 어떻게 메울 것인가에 대한 문제의식을 명확히 보여준다. 그의 강연은 불확실성 하에서의 계획(planning under uncertainty)과 상위 수준의 과제 명세로부터 하위 수준의 동작 목표를 자동으로 추론하는 연구의 중요성을 강조하며, 미래 로봇 연구의 방향성을 제시했다.
4.3 최우수 논문 최종후보작 심층 분석
IROS 2011의 최우수 논문 최종후보(Best Paper Finalist)로 선정된 연구들은 로봇 지능의 가장 기초가 되는 ‘지각(perception)’ 능력의 근본적인 문제를 해결하는 데 집중하고 있다. 이는 견고한 지각 없이는 진정한 자율성이 불가능하다는 당시 학계의 공감대를 반영한다.
4.3.1 다중양식 학습: Autonomous Acquisition of Multimodal Information for Online Object Concept Formation by Robots
인간은 물체를 이해할 때 시각, 청각, 촉각 등 여러 감각 정보를 자연스럽게 통합한다. 로봇에게 이러한 능력을 부여하는 것은 기호 접지 문제(symbol grounding problem), 즉 로봇이 ’사과’라는 단어를 실제 사과의 시각적 형태, 만졌을 때의 단단함, 베어 물었을 때의 소리 등과 연결하는 문제와 직결된다.
-
연구 목표: 혼다 연구소의 Mikio Nakano, Kotaro Funakoshi 연구팀은 로봇이 인간처럼 시각, 청각, 촉각 등 여러 감각(multimodal) 정보를 스스로 획득하고 통합하여, 처음 보는 물체에 대한 개념을 온라인으로 형성하게 하는 것을 목표로 했다.34
-
방법론: 이 연구는 딥러닝 기반의 다중양식 임베딩이 보편화되기 이전 시점에, 확률적 생성 모델을 통해 이 문제를 해결했다. 잠재 디리클레 할당(Latent Dirichlet Allocation, LDA)을 다중양식으로 확장한 MLDA(Multimodal LDA)와 같은 모델을 기반으로 했을 가능성이 높다.36 로봇은 물체를 탐색하며 얻은 시각(이미지 특징), 청각(물체를 두드렸을 때 나는 소리), 촉각(물체의 재질이나 형태) 데이터를 통합하여, 관측 데이터의 이면에 존재하는 잠재적인 ‘개념(concept)’ 또는 ’토픽(topic)’으로 군집화한다. 이 학습된 모델을 통해, 예를 들어 물체의 소리만 듣고도 그 시각적 형태나 재질을 예측하는 것과 같은 교차양식 추론(cross-modal inference)이 가능해진다.38
-
주요 결과: 로봇이 사전에 프로그래밍되지 않은 물체에 대해서도 다양한 감각 정보를 자율적으로 탐색하고, 이를 바탕으로 객체 개념을 성공적으로 온라인 학습함을 보였다.34 이는 로봇이 보다 유연하게 다양한 물체를 조작하고 인간과 소통할 수 있는 기반 기술이 될 수 있음을 시사한다.
-
학술적 의의: 이 연구는 로봇이 물리적 세계와의 상호작용을 통해 스스로 지식을 습득하는 ’체화된 AI(Embodied AI)’의 핵심적인 연구 방향을 제시한다.39 당시 지배적이었던 베이즈 확률론을 통해 불확실한 다중 감각 정보를 통합하고 추상적인 개념을 형성하려는 시도는, 이후 다중양식 표현 학습(multimodal representation learning) 연구의 중요한 초석이 되었다.
4.3.2 로봇 청각: SLAM-based Online Calibration of Asynchronous Microphone Array for Robot Audition
로봇이 인간과 자연스럽게 상호작용하거나 주변 환경의 소리를 이해하기 위해서는 로봇 청각(robot audition) 기술이 필수적이다. 여러 개의 마이크로폰으로 구성된 어레이는 소리의 방향을 탐지하고 특정 음원을 분리하는 데 효과적이지만, 각 마이크의 정확한 상대적 위치를 알아야 하고 모든 마이크의 신호가 정밀하게 동기화되어야 한다는 전제 조건이 따른다. 이는 실제 로봇에 적용하는 데 큰 제약이 되어왔다.41
-
연구 목표: 혼다 연구소의 Kazuhiro Nakadai, Keisuke Nakamura 연구팀은 로봇 청각 시스템의 핵심인 마이크로폰 어레이의 물리적 위치와 시간적 비동기성(asynchronicity) 문제를 온라인으로, 그리고 자율적으로 교정(calibration)하는 방법을 개발하고자 했다.34
-
방법론: 이 연구는 로봇 항법(navigation) 분야의 핵심 기술인 SLAM(Simultaneous Localization and Mapping)을 청각 문제에 창의적으로 적용했다. 일반적으로 SLAM은 로봇이 자신의 위치를 추정하면서 동시에 주변 환경의 지도를 작성하는 기술이다. 연구팀은 이 프레임워크를 역으로 적용하여, 움직이는 음원(sound source)을 ’로봇’으로, 위치를 모르는 마이크로폰들을 ’정적인 랜드마크’로 간주했다. 로봇은 여러 위치에서 관측된 음원의 방향(Direction of Arrival, DOA)과 마이크 간 도달 시간차(Time Difference of Arrival, TDOA) 정보를 이용하여, 베이즈 필터링(예: 파티클 필터) 기반의 SLAM 알고리즘을 통해 음원의 궤적과 마이크들의 위치 및 시간 오프셋을 동시에 추정한다.41
-
주요 결과: 기존 방식처럼 마이크 위치를 수동으로 정밀하게 측정하거나 고가의 동기화 장비를 사용할 필요 없이, SLAM 프레임워크를 통해 비동기 마이크로폰 어레이를 효과적으로 온라인 교정할 수 있음을 입증했다.34 이는 로봇 청각 기술의 실용성과 적용 가능성을 획기적으로 높인 성과이다.
-
학술적 의의: 이 연구는 한 분야(지도 작성 및 항법)에서 성공적으로 검증된 핵심 알고리즘(SLAM)을 전혀 다른 분야(로봇 청각)의 문제 해결에 성공적으로 이식한 학제 간 기술 융합의 대표적인 사례이다.45 이는 문제의 구조적 유사성을 통찰하여 기존 기술의 적용 범위를 창의적으로 확장하는 중요한 연구 방법론을 제시했으며, 불확실성을 다루는 베이즈 확률론이 2011년 당시 로봇공학 분야에서 얼마나 지배적인 이론적 틀이었는지를 명확히 보여준다.
5. 결론: 2011년 3분기 연구 동향 종합 및 기술사적 의의
2011년 3분기는 인공지능과 로봇공학 분야가 이론적 깊이를 더하고 실용적 지평을 넓히며 내실을 다진 중요한 시기였다. 이 시기의 연구들은 딥러닝 혁명 직전, 논리, 확률 모델, 최적화 이론에 기반한 정교한 알고리즘들이 도달한 기술적 정점을 보여준다. 표 2는 본 보고서에서 분석한 주요 수상 논문들의 핵심 기여와 의의를 요약한 것이다.
표 2: 2011년 3분기 주요 수상 논문 요약
| 학회 | 논문 제목 | 핵심 분야 | 핵심 기여 | 기술사적 의의 |
|---|---|---|---|---|
| IJCAI-11 | Nested Rollout Policy Adaptation for Monte Carlo Tree Search | 탐색/최적화 | 롤아웃 정책을 동적으로 학습하는 MCTS(NRPA) 제안 | 알파고 정책망의 선구적 아이디어 |
| On the Decidability of Connectedness Constraints in 2D and 3D Euclidean Spaces | 공간 추론 | 연결성 제약 포함 시 2D 공간 추론의 결정 불가능성 증명 | 질적 추론의 근본적인 계산적 한계 규명 | |
| Unweighted Coalitional Manipulation under the Borda Rule Is NP-Hard | 계산 사회 선택 | 보르다 규칙 하의 비가중 연합 조작 문제의 NP-난해성 증명 | 계산 사회 선택 분야의 오랜 난제 해결 | |
| AAAI-11 | Complexity of and Algorithms for Borda Manipulation | 알고리즘 게임 이론 | 보르다 조작 문제의 NP-난해성 증명 및 해결 알고리즘 제시 | 이론적 증명과 실용적 해결을 동시에 추구 |
| Dynamic Resource Allocation in Conservation Planning | 계산 지속가능성 | 불확실성 하의 동적 자원 할당 문제에 대한 효율적, 준최적 알고리즘 제시 | ‘AI for Social Good’ 분야의 중요한 이정표 | |
| IROS 2011 | Autonomous Acquisition of Multimodal Information for Online Object Concept Formation by Robots | 다중양식 학습 | 다중 감각 정보 통합을 통한 온라인 객체 개념 형성 방법론 제시 | 체화된 AI 및 다중양식 표현 학습의 초석 |
| SLAM-based Online Calibration of Asynchronous Microphone Array for Robot Audition | 로봇 청각 | SLAM 기술을 이용한 비동기 마이크로폰 어레이 온라인 교정 | 로봇 지각 문제에 대한 창의적 기술 융합 사례 |
이 시기의 연구 동향은 다음과 같이 네 가지 핵심 흐름으로 요약할 수 있다.
-
계산적 한계와 가능성의 탐구: NP-난해성, 결정 불가능성 증명을 통해 문제의 본질적인 어려움을 규명하려는 이론적 성숙이 두드러졌다. 이는 AI가 무엇을 할 수 있고 없는지에 대한 근본적인 이해를 추구하는 단계에 이르렀음을 의미한다.
-
’AI for Good’의 부상: AI 기술을 환경 보전과 같은 인류의 난제 해결에 적용하려는 계산 지속가능성 연구가 본격화되었다. 이는 AI의 사회적 책임과 역할에 대한 인식이 학계 전반으로 확산되고 있었음을 보여준다.
-
체화된 지능과 다중양식 학습: 로봇이 단순히 명령을 수행하는 기계를 넘어, 물리적 상호작용을 통해 여러 감각 정보를 통합하여 세상을 이해하고 학습하는 주체가 되어야 한다는 연구가 심화되었다.
-
기존 기술의 창의적 융합: SLAM과 같은 한 분야의 검증된 알고리즘을 전혀 다른 문제(로봇 청각)에 성공적으로 적용하는 등, 학문 분야 간의 경계를 넘나드는 창의적인 문제 해결 방식이 주목받았다.
기술사적 관점에서 2011년 3분기는 한 시대의 정점이자, 다가올 새로운 시대의 서막을 여는 문제들을 정의한 ’징검다리’와 같은 시기였다. 이 시기 연구들이 제기했던 도전들, 즉 대규모 비정형 데이터 처리(Watson), 복잡한 패턴 인식(다중양식 학습), 고차원 공간에서의 최적화(동작 계획) 등은 바로 1년 뒤 등장할 딥러닝이 가장 효과적으로 해결하게 될 문제들이었다. 따라서 2011년의 이론적 고민과 현실 문제에 대한 도전은 이후 딥러닝 기술과 결합하여 현재의 AI 붐을 일으키는 풍부한 자양분이 되었다고 평가할 수 있다.
6. 참고 자료
- AAAI-11: Twenty-Fifth Conference on Artificial Intelligence, https://aaai.org/conference/aaai/aaai11/
- AAAI-11 / IAAI-11: Invited Speakers - The Association for the Advancement of Artificial Intelligence, https://aaai.org/conference/aaai/aaai11/aaai11speakers/
- AI*IA 2011: Artificial Intelligence Around Man and Beyond: XIIth International Conference of the Italian Association for Artificial Intelligence, Palermo, Italy, September 15-17, 2011. Proceedings - ResearchGate, https://www.researchgate.net/publication/268999207_AIIA_2011_Artificial_Intelligence_Around_Man_and_Beyond_XIIth_International_Conference_of_the_Italian_Association_for_Artificial_Intelligence_Palermo_Italy_September_15-17_2011_Proceedings
- Proceedings of the Twenty-Second International Joint Conference on Artificial Intelligence, https://www.ijcai.org/proceedings/2011
- Proceedings of the Twenty-Second International Joint Conference on Artificial Intelligence - IJCAI, https://www.ijcai.org/Proceedings/11/Papers/000.pdf
- Proceedings of the IJCAI-2011 Workshop on Social Choice and Artificial Intelligence - Institute for Logic, Language and Computation, https://www.illc.uva.nl/~ulle/pubs/files/ElkindEndrissLangWSCAI2011.pdf
- IJCAI Workshop on Social Choice and Artificial Intelligence (2011), https://www.illc.uva.nl/COMSOC/IJCAI-2011/
- Awards and Distinguished Papers - IJCAI, https://www.ijcai.org/Proceedings/11/Papers/006.pdf
- IJCAI Awards, https://www.ijcai.org/awards
- Abstract - IJCAI, https://www.ijcai.org/Abstract/11/115
- Nested Rollout Policy Adaptation for Monte Carlo Tree Search - IJCAI, https://www.ijcai.org/Proceedings/11/Papers/115.pdf
- Nested Rollout Policy Adaptation for Monte Carlo Tree Search. - ResearchGate, https://www.researchgate.net/publication/220814760_Nested_Rollout_Policy_Adaptation_for_Monte_Carlo_Tree_Search
- Beam Nested Rollout Policy Adaptation - Lamsade, https://www.lamsade.dauphine.fr/~cazenave/papers/CazenaveBeam.pdf
- On the Decidability of Connectedness Constraints in 2D and … - IJCAI, https://www.ijcai.org/Proceedings/11/Papers/165.pdf
- On the Decidability of Connectedness Constraints in 2D and 3D Euclidean Spaces, https://www.semanticscholar.org/paper/On-the-Decidability-of-Connectedness-Constraints-in-Kontchakov-Nenov/8689badbd236924700dc8f746f2c8044783157c7
- Homepage of Dr Ian Pratt-Hartmann - The University of Manchester, https://personalpages.manchester.ac.uk/staff/ian.pratt/
- On the Decidability of Connectedness Constraints in 2D and 3D Euclidean Spaces - Semantic Scholar, https://pdfs.semanticscholar.org/70e0/5243d8dcd3385388c5082f82c1ea1c916f0d.pdf
- On the Decidability of Connectedness Constraints in 2D and 3D Euclidean Spaces - Full paper at ijcai-11, https://ijcai-11.tripod.com/iIJCAI-4.19.pdf
- Complexity of and Algorithms for Borda Manipulation - George Katsirelos, https://gkatsi.github.io/papers/dknwaaai11.pdf
- Unweighted Coalitional Manipulation Under the Borda Rule … - IJCAI, https://www.ijcai.org/Proceedings/11/Papers/021.pdf
- Unweighted Coalitional Manipulation under the Borda Rule Is NP, https://www.researchgate.net/publication/220815522_Unweighted_Coalitional_Manipulation_under_the_Borda_Rule_Is_NP-Hard
- Exact Algorithms for Weighted and Unweighted Borda Manipulation Problems, https://www.researchgate.net/publication/258841645_Exact_Algorithms_for_Weighted_and_Unweighted_Borda_Manipulation_Problems
- Complexity of Unweighted Coalitional Manipulation Under Some Common Voting Rules - CMU School of Computer Science, https://www.cs.cmu.edu/~conitzer/unweighted_manipulationIJCAI09.pdf
- AAAI Conference Paper Awards and Recognition - AAAI, https://aaai.org/about-aaai/aaai-awards/aaai-conference-paper-awards-and-recognition/
- Conference Program - The Association for the Advancement of Artificial Intelligence, https://aaai.org/wp-content/uploads/2023/01/aaai11program.pdf
- CompSust11 – Computational Sustainability at AAAI11, https://computationallythinking.wordpress.com/2011/08/12/compsust11-computational-sustainability-at-aaai11/
- Dynamic Resource Allocation in Conservation Planning | Request PDF - ResearchGate, https://www.researchgate.net/publication/363508917_Dynamic_Resource_Allocation_in_Conservation_Planning
- (PDF) Dynamic Resource Allocation in Conservation Planning - ResearchGate, https://www.researchgate.net/publication/221604561_Dynamic_Resource_Allocation_in_Conservation_Planning
- Daniel Golovin’s Publications Page, https://www.cs.cmu.edu/~dgolovin/pubs.htm
- [PDF] Dynamic Resource Allocation in Conservation Planning | Semantic Scholar, https://www.semanticscholar.org/paper/Dynamic-Resource-Allocation-in-Conservation-Golovin-Krause/1f9a83982a9dad2ba9ec991e216d887936c3d40e
- IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS 2011) Student Travel Awards - CPS-VO, https://cps-vo.org/node/23810
- IROS 2011, https://ewh.ieee.org/soc/ras/conf/financiallycosponsored/IROS/2011/IROS/www.iros2011.org/images/stories/IROS2011EventsGuide.pdf
- International Conference on Intelligent Robots and Systems - Wikipedia, https://en.wikipedia.org/wiki/International_Conference_on_Intelligent_Robots_and_Systems
- IROS 2011 Best Paper Finalist Awards | Honda Research Institute …, https://www.jp.honda-ri.com/en/information/1064/20111103/
- IROS 2011 Special Symposium: Robot Motion Planning: Achievements and Emerging Approaches, https://robotics.cs.unc.edu/IROS2011-Symposium/
- Full article: Concept formation through multimodal integration using multimodal BERT and VQ-VAE - Taylor & Francis Online, https://www.tandfonline.com/doi/full/10.1080/01691864.2022.2141583
- Hierarchical Spatial Concept Formation Based on Multimodal Information for Human Support Robots - Frontiers, https://www.frontiersin.org/journals/neurorobotics/articles/10.3389/fnbot.2018.00011/full
- arXiv:1509.08973v1 [cs.AI] 29 Sep 2015, https://arxiv.org/pdf/1509.08973
- Mikio Nakano | C4A Research Institute, Inc., https://www.c4a.jp/en/mikio-nakano/
- Long-Term Learning of Concept and Word by Robots: Interactive, http://vigir.missouri.edu/~gdesouza/Research/Conference_CDs/IEEE_IROS_2013/media/files/1816.pdf
- Online Simultaneous Localization and Mapping of Multiple Sound Sources and Asynchronous Microphone Arrays, http://sap.ist.i.kyoto-u.ac.jp/EN/bib/intl/SEK-IROS16.pdf
- SLAM-Based Online Calibration of Asynchronous Microphone Array, https://www.researchgate.net/profile/Kazuhiro-Nakadai/publication/221066012_SLAM-based_online_calibration_of_asynchronous_microphone_array_for_robot_audition/links/0deec5179622aaf687000000/SLAM-based-online-calibration-of-asynchronous-microphone-array-for-robot-audition.pdf
- Simultaneous asynchronous microphone array calibration and sound source localisation - OPUS at UTS, https://opus.lib.uts.edu.au/bitstream/10453/37833/5/IROS15_submitted.pdf
- Robotic Sound Source Mapping using Microphone Arrays - OPUS at UTS, https://opus.lib.uts.edu.au/bitstream/10453/120196/2/02whole.pdf
- [PDF] SLAM-based online calibration of asynchronous microphone, https://www.semanticscholar.org/paper/SLAM-based-online-calibration-of-asynchronous-array-Miura-Yoshida/2617f4747166d98b6a43146eb26341525a6dbff6
- Asynchronous Microphone Array Calibration using Hybrid TDOA Information - arXiv, https://arxiv.org/html/2403.05791v1