년 4분기 AI 및 로봇 연구 동향
1. 서론
2013년 4분기는 인공지능(AI) 및 로봇 공학 분야의 역사에서 중요한 변곡점으로 기록된다. 2012년 AlexNet이 이미지 인식 분야에 가져온 충격적인 성능 향상 이후, 딥러닝은 학계와 산업계 전반에 걸쳐 거부할 수 없는 주류 패러다임으로 급부상하기 시작했다. 이 시기는 대규모 데이터셋의 가용성 증대와 그래픽 처리 장치(GPU)를 위시한 계산 능력의 비약적인 발전이 맞물리면서, 알고리즘의 ’확장성(scalability)’과 실제 세계 문제에 대한 ’적용 가능성’이 연구의 핵심 화두로 떠오른 결정적인 순간이었다. 본 보고서는 이러한 기술적, 시대적 배경 속에서 2013년 4분기에 개최된 세계 최고 수준의 학회들—신경정보처리시스템학회(NeurIPS), 지능형 로봇 및 시스템 국제 학회(IROS), 컴퓨터 비전 국제 학회(ICCV)—과 해당 분기에 주요 학술지에 발표된 가장 영향력 있는 연구들을 심층적으로 분석하고 그 학문적 의의와 후속 연구에 미친 영향을 조명하고자 한다.
이 시기의 연구 지형은 단일한 흐름으로 정의되지 않는다. 한편에서는 딥러닝이 컴퓨터 비전과 같은 인식 과제에서 지배력을 빠르게 공고히 하고 있었고(ICCV, NeurIPS), 다른 한편에서는 기계학습의 근간을 이루는 이론적 질문들—서브모듈러 최적화, 인과 추론, 기억의 물리적 한계 등(NeurIPS)—과 로봇 공학에서의 복잡한 시스템 통합 문제(IROS)에 대한 활발한 탐구가 동시에 이루어졌다. 즉, 2013년 4분기는 딥러닝이라는 강력한 새 도구를 적극적으로 활용하는 ’통합(Consolidation)’의 흐름과, 더 넓은 분야의 이론적, 실용적 기둥을 강화하려는 ’탐색(Exploration)’의 흐름이 역동적으로 상호작용하던 시기였다. 본 보고서는 각 장을 주요 학회 중심으로 구성하며, 각 학회 내에서는 최우수 논문상(Best/Outstanding Paper Award) 수상작을 집중적으로 해부하여 당시 연구의 정점을 탐색한다. 또한, 주요 학술지 분석을 통해 컨퍼런스 발표 주기 너머의 지속적인 연구 흐름을 추적함으로써 2013년 4분기가 현재의 AI 시대를 어떻게 예비했는지 다각적으로 고찰한다.
| 학회명 (Conference Name) | 개최 기간 (Dates) | 개최지 (Location) | 주요 연구 주제 (Key Research Themes) |
|---|---|---|---|
| NeurIPS 2013 | 2013.12.05 - 12.11 | 미국, 레이크 타호 | 딥러닝, 대규모 분산 학습, 이산 최적화, 확률 모델, 신경과학 기반 학습 이론 |
| ICCV 2013 | 2013.12.01 - 12.08 | 호주, 시드니 | 대규모 이미지 분류, 객체 탐지, 3D 재구성, 비전과 언어의 결합 |
| IROS 2013 | 2013.11.03 - 11.08 | 일본, 도쿄 | SLAM, 인간-로봇 상호작용(HRI), 모방 학습, 소프트 로보틱스, 필드 로보틱스 |
2. 제27회 신경정보처리시스템학회 (NeurIPS 2013) 주요 발표 동향
2.1 학회 개요 및 핵심 주제
2013년 12월 5일부터 11일까지 미국 네바다주 레이크 타호에서 개최된 제27회 신경정보처리시스템학회(당시 NIPS, 현 NeurIPS)는 기계학습 분야가 전례 없는 성장과 변화를 겪고 있음을 여실히 보여주는 장이었다.1 이 시기 NIPS는 딥러닝의 폭발적인 성공에 힘입어 학문적 관심이 집중되는 가운데, 그 이면에서 기계학습의 근간을 이루는 다양한 이론적, 방법론적 연구들이 균형 있게 논의되는 성숙한 학문 공동체의 모습을 보였다.
학회의 핵심 주제는 단연 ’딥러닝’이었으나, 그 논의는 단순한 성능 향상을 넘어 딥러닝 모델의 작동 원리를 이해하려는 시도, 그리고 이를 더 큰 규모의 데이터와 문제에 적용하기 위한 방법론으로 확장되었다.4 특히 ‘Big Learning’ 워크숍과 같은 세션들은 대규모 데이터셋을 효율적으로 처리하기 위한 분산 학습(distributed learning)과 최적화 알고리즘의 확장성(scalability) 문제를 집중적으로 다루었다.4 이는 기계학습이 학문적 탐구를 넘어 산업적 규모의 문제 해결 도구로 자리 잡기 시작했음을 시사한다. 이와 동시에, 서브모듈러 최적화(submodular optimization)와 같은 이산 최적화 문제, 확률 모델링 및 추론(probabilistic modeling and inference), 그리고 강화학습(reinforcement learning)과 같은 전통적인 기계학습의 핵심 분야들 역시 깊이 있는 연구들이 다수 발표되며 이론적 토대를 공고히 했다.4 NeurIPS 2013은 딥러닝이라는 강력한 엔진을 장착함과 동시에, 기계학습이라는 거대한 학문 체계의 근본적인 질문들을 놓치지 않으려는 커뮤니티의 건강한 긴장감이 돋보이는 학회였다.
2.2 최우수 논문상 (Outstanding Paper Award) 심층 분석
NeurIPS 2013의 최우수 논문상 수상작 세 편은 당시 기계학습 연구의 다각적인 면모를 상징적으로 보여준다.5 이 논문들은 각각 신경과학에 기반한 뇌의 학습 원리 탐구, 복잡한 현실 세계의 선택 문제를 수학적으로 모델링하는 이산 최적화, 그리고 사회적 현상을 분석하는 대규모 네트워크 동역학이라는, 서로 다른 차원의 지능을 다루고 있다. 표면적으로 이질적인 이 세 연구의 동시 수상은, 인공지능의 발전이 단일한 알고리즘 패러다임을 넘어서 지능의 물리적 기질(뇌), 추상적 추론 과정(논리), 그리고 집단적 발현 행동(사회)이라는 세 가지 근본적인 측면에 대한 균형 잡힌 탐구를 통해 이루어진다는 커뮤니티의 깊은 통찰을 반영한다. 이는 당시 학회가 딥러닝의 열풍 속에서도 지능의 다층적 본질에 대한 탐구를 최고 수준의 학문적 성취로 인정했음을 의미한다.
2.2.1 복잡한 시냅스의 기억 용량 한계 규명: “A memory frontier for complex synapses”
이 연구는 신경과학과 기계학습의 경계에서 기억의 근본적인 물리적 한계에 대한 질문을 던진다.
-
연구 목표 및 배경: 전통적인 신경망 이론 모델들은 시냅스를 단일 스칼라 가중치로 단순화하여 모델링해왔다. 그러나 실제 생물학적 시냅스는 수많은 분자 신호 경로가 얽힌 복잡한 동적 시스템이다. 특히, 시냅스 강도가 몇 개의 이산적인 상태만을 가질 수 있다는 실험적 증거들은 기존의 아날로그 가중치 모델에 근본적인 의문을 제기했다. 이산적인 강도를 갖는 시냅스 모델(디지털 시냅스)은 기억 용량이 시냅스 수의 로그에 비례하여 치명적으로 낮아지는 ‘기억력 재앙(memory catastrophe)’ 문제를 야기한다.6 본 연구는 이러한 한계를 극복하기 위해, 시냅스 내부의 분자적 복잡성을 명시적으로 모델링하여 그것이 어떻게 기억 용량을 증대시킬 수 있는지에 대한 이론적 프레임워크를 구축하고자 했다.6
-
방법론: 연구진은 시냅스를 M개의 내부 상태를 갖는 확률적 동적 시스템으로 모델링했다. 시냅스 강화(potentiation) 및 약화(depression) 이벤트는 각 상태 간의 전이를 유도하는 이산 시간 마르코프 전이 행렬 M_{pot}와 M_{dep}로 표현된다. 기억의 품질은 시간이 지남에 따라 기억 패턴이 얼마나 잘 유지되는지를 측정하는 신호 대 잡음비(Signal-to-Noise Ratio, SNR)로 정량화되었다. 이들은 특정 모델을 분석하는 데 그치지 않고, 가능한 모든 M-상태 시냅스 동역학 시스템 공간 전체를 고려하여 메모리 성능의 이론적 상한, 즉 ’메모리 프론티어(memory frontier)’를 도출하는 일반 이론을 개발했다.6
-
핵심 결과 및 학문적 기여: 이 논문은 시냅스 내부 상태의 수(M)가 증가함에 따라 메모리 수명이 어떻게 확장될 수 있는지에 대한 근본적인 한계를 수학적으로 규명했다. 가장 중요한 발견 중 하나는, 최적의 메모리 성능을 달성하는 시냅스 동역학 구조는 상태들이 순차적으로 전이하는 ‘선형 체인(linear chain)’ 토폴로지를 가져야 한다는 점을 증명한 것이다.6 이는 복잡한 분자 네트워크 내부에 숨겨진 단순한 구조적 원리가 장기 기억의 핵심일 수 있음을 시사한다. 이 연구는 뇌의 학습 및 기억 메커니즘에 대한 이론적 이해를 한 단계 심화시켰을 뿐만 아니라, 미래의 뉴로모픽 컴퓨팅 하드웨어나 새로운 인공 신경망 아키텍처를 설계하는 데 있어 시냅스 내부의 동적 상태를 어떻게 구조화해야 하는지에 대한 중요한 이론적 지침을 제공했다는 점에서 큰 학문적 기여를 했다.7
-
핵심 수식: 논문은 시간 t에서의 SNR을 시냅스 동역학 행렬의 고유 모드(eigenmode) 분해를 통해 다음과 같이 표현했다. 이 수식은 기억이 여러 시간 척도(\tau_a)를 가진 구성 요소들의 합으로 점차 소멸해가는 과정을 명확히 보여준다.
\text{SNR}(t) = \sqrt{N} \sum_a I_a e^{-rt/\tau_a}
여기서 N은 시냅스의 수, I_a는 각 고유 모드의 초기 영향력, \tau_a는 기억의 감쇠 시간을 나타내는 시상수(time constant)이다.6
2.2.2 서브모듈러 최적화 문제의 새로운 지평: “Submodular Optimization with Submodular Cover and Submodular Knapsack Constraints”
이 연구는 기계학습의 다양한 응용 분야에서 발생하는 본질적인 이산 최적화 문제를 다룬다.
-
연구 목표 및 배경: 기계학습에서 센서 배치, 데이터 요약, 특징 선택과 같은 수많은 문제는 ’다양성’이나 ’정보량’과 같은 서브모듈러 함수 g를 최대화하면서 동시에 ’비용’과 같은 또 다른 서브모듈러 함수 f를 최소화해야 하는 복잡한 상황에 직면한다. 기존에는 이러한 문제를 두 서브모듈러 함수의 차이(g-f)를 최적화하는 문제로 접근했으나, 이는 최악의 경우 근사 해를 찾는 것조차 불가능하다는 이론적 한계가 있었다.10 본 연구는 이러한 난제를 해결하기 위해, 문제를 제약 조건이 있는 최적화 문제로 새롭게 정식화하여 실용적인 근사 해법을 찾고자 했다.
-
방법론: 연구진은 두 가지 새로운 형태의 이산 최적화 문제를 정의했다. 첫째는 ‘서브모듈러 비용 서브모듈러 커버(Submodular Cost Submodular Cover, SCSC)’ 문제로, 서브모듈러 함수 g의 값이 특정 임계치 c 이상이 되도록 하면서 비용 함수 f를 최소화하는 문제(\min\{f(X) \vert g(X) \ge c\})이다. 둘째는 ‘서브모듈러 비용 서브모듈러 냅색(Submodular Cost Submodular Knapsack, SCSK)’ 문제로, 비용 함수 f가 예산 b를 넘지 않도록 하면서 함수 g를 최대화하는 문제(\max\{g(X) \vert f(X) \le b\})이다. 이 두 문제는 서로 밀접하게 연관되어 있으며, 연구진은 이 문제들을 해결하기 위해 탐욕 알고리즘(greedy algorithm)에 기반한 다항 시간 근사 알고리즘을 제안하고, 그 성능 보증(approximation guarantee)을 이론적으로 분석했다.11
-
핵심 결과 및 학문적 기여: 본 논문은 SCSC와 SCSK 문제에 대해 이론적으로 보장된 근사 비율을 갖는 효율적인 알고리즘을 최초로 제공했다. 또한, 이 근사 비율이 문제의 고유한 난이도를 고려할 때 로그 인자(log-factor) 내에서 거의 최적(tight)임을 증명하여 이론적 완결성을 높였다.10 이 연구의 가장 큰 기여는 복잡한 현실 세계의 자원 할당 및 선택 문제를 풀 수 있는 강력하고 실용적인 수학적 도구를 기계학습 커뮤니티에 제공했다는 점이다. 이는 이후 데이터 요약, 능동 학습(active learning), 영향력 최대화 등 다양한 분야에서 공정성(fairness), 강건성(robustness)과 같은 추가적인 제약 조건을 고려하는 복잡한 서브모듈러 최적화 연구가 활발히 이루어지는 이론적 기틀을 마련했다.12
-
핵심 개념: 서브모듈러 함수는 집합에 원소를 추가할 때 얻는 한계 이득이 점차 감소하는 ’수확 체감(diminishing returns)’의 속성을 갖는다. 이는 다음과 같은 수식으로 정의된다.
f(j \mid S) \ge f(j \mid T) \quad \text{for all } S \subseteq T \text{ and } j \notin T,
\text{where } f(j \mid S) := f(S \cup \{j\}) - f(S)
.11
2.2.3 연속 시간 확산 네트워크에서의 영향력 추정: “Scalable Influence Estimation in Continuous-Time Diffusion Networks”
이 연구는 소셜 네트워크와 같은 거대하고 동적인 시스템의 행동을 예측하는 문제에 초점을 맞춘다.
-
연구 목표 및 배경: 소셜 미디어에서 특정 정보(뉴스, 루머 등)가 주어진 시간 내에 얼마나 널리 퍼져나갈지를 예측하는 ‘영향력 추정’ 문제는 바이럴 마케팅, 공중 보건 등 다양한 분야에서 핵심적인 문제이다. 그러나 수백만, 수억 개의 노드로 구성된 실제 네트워크에서 정보 전파의 복잡한 동역학을 시뮬레이션하는 것은 계산적으로 매우 어렵다. 특히, 정보 전파가 이산적인 시간이 아닌 연속적인 시간 위에서 일어나는 현실을 모델링하면서도 확장성을 확보하는 것은 큰 도전 과제였다.15
-
방법론: 연구진은 이 문제를 해결하기 위해 독창적인 관점의 전환을 제안했다. 정보가 각 연결(edge)을 통해 전파되는 데 걸리는 시간을 확률 변수로 보고, 특정 노드가 감염되는 것은 시작점으로부터 해당 노드까지의 ‘최단 전파 경로’ 시간이 주어진 시간 T보다 짧은 경우로 재해석했다. 이 접근법을 통해, 복잡한 전파 시뮬레이션 문제가 그래프에서의 최단 경로 문제로 변환된다. 여기서 더 나아가, 모든 노드에 대해 개별적으로 최단 경로를 계산하는 대신, 전체 네트워크에 대해 무작위로 샘플링된 가중치를 부여하고 각 노드로부터 도달 가능한 ’이웃의 크기(neighborhood size)’를 효율적으로 추정하는 알고리즘으로 문제를 다시 한번 변환했다. 이
CONTINEST알고리즘은 소수의 무작위 샘플링만으로 네트워크 내 모든 노드의 영향력을 동시에, 그리고 매우 빠르게 근사할 수 있게 한다.15 -
핵심 결과 및 학문적 기여: 이 논문은 \epsilon의 정확도로 영향력을 추정하는 데 필요한 계산량이 네트워크 크기(|V|, |E|)에 거의 선형적으로 비례함(O(n|E|+n|V|), 여기서 n=O(1/\epsilon^2))을 보였다. 이는 이전 방법들과 비교할 수 없을 정도로 뛰어난 확장성으로, 수백만 노드 규모의 네트워크에서도 시간 제약이 있는 영향력 분석을 실용적으로 가능하게 만들었다.15 이 연구의 기여는 단순히 빠른 알고리즘을 제시한 것을 넘어, 복잡한 동적 시스템 분석 문제를 확장 가능한 그래프 알고리즘 문제로 성공적으로 치환하는 강력한 방법론적 틀을 제시했다는 데 있다. 이는 이후 네트워크 과학, 전산 사회과학, 기계학습의 융합 연구에 큰 영향을 미쳤으며, 정보 확산, 바이러스 전파 등 다양한 동적 네트워크 프로세스 분석에 널리 활용되었다.17
-
핵심 수식: 시간 T 내에서의 영향력 \sigma(A, T)는 초기 전파자 집합 A로부터 시작하여 시간 T 이전에 감염되는 노드 수의 기댓값으로 정의된다.
\sigma(A, T) = E\left[\sum_{i \in V} \mathbb{I}(t_i \le T)\right]
여기서 A는 초기 시드 집합, T는 시간 제한, t_i는 노드 i의 감염 시간, I는 지시 함수(indicator function)이다.15
3. 2013 IEEE 지능형 로봇 및 시스템 국제 학회 (IROS 2013) 핵심 연구
3.1 학회 개요 및 주요 연구 분야
2013년 11월 3일부터 8일까지 일본 도쿄 빅사이트에서 개최된 IEEE/RSJ 지능형 로봇 및 시스템 국제 학회(IROS 2013)는 “새로운 지평(New Horizon)“이라는 주제 아래, 로봇 공학이 직면한 새로운 도전과 기회를 모색하는 자리였다.20 이 시기 IROS는 전통적인 로봇 공학의 핵심 주제들을 심화시키는 동시에, 인공지능 기술과의 융합을 통해 로봇의 지능과 자율성을 한 단계 끌어올리려는 노력이 두드러졌다.
학회에서 발표된 연구들은 로봇 공학의 광범위한 스펙트럼을 포괄했다. 동시적 위치추정 및 지도작성(SLAM), 특히 대규모 환경에서의 강건한 SLAM 기술은 여전히 중요한 연구 분야였다.22 또한, 로봇이 인간과 같은 공간에서 안전하고 효율적으로 협업하기 위한 인간-로봇 상호작용(HRI) 기술, 그리고 인간의 시연으로부터 복잡한 기술을 학습하는 모방 학습(Imitation Learning) 및 강화학습에 대한 연구가 활발히 이루어졌다.22 시각 센서를 이용해 로봇의 움직임을 정밀하게 제어하는 시각 서보(Visual Servoing) 역시 주요 연구 주제 중 하나였다.22 특히, IROS 2013은 로봇 공학자인 모리 마사히로 교수를 기리는 ‘불쾌한 골짜기(The Uncanny Valley) 재조명’ 특별 세션을 마련하여, 로봇 기술의 발전이 인간의 감성과 사회에 미치는 영향에 대한 깊이 있는 성찰의 기회를 제공했다는 점에서 주목할 만하다.21 이는 IROS 커뮤니티가 기술적 성취뿐만 아니라 그 사회적, 철학적 함의까지 중요하게 여기고 있음을 보여준다.
3.2 주요 수상 논문 분석
IROS는 다수의 후원 기관과 협력하여 자동화, 인지 로보틱스, 조작, 의료, 서비스 등 다양한 세부 분야에 걸쳐 최우수 논문상을 시상한다.24 이는 로봇 공학이 단일한 평가 기준이 아닌, 학문적 독창성, 실제 산업 현장에서의 적용 가능성, 인간의 인지 과정과의 유사성, 사회적 기여 등 다각적인 가치를 추구하는 복합 학문임을 명확히 보여준다. 이러한 다양한 수상 부문은 IROS가 이론과 실제, 과학과 공학을 잇는 가교 역할을 하고 있음을 시사한다.25
3.2.1 RoboCup 최우수 논문: “3D Path Planning and Execution for Search and Rescue Ground Robots”
IROS 2013에서 RoboCup 최우수 논문으로 선정된 이 연구는 로봇 공학의 핵심 가치인 ’시스템 통합’의 중요성을 명확히 보여준다.39
-
연구 목표 및 배경: 지진, 건물 붕괴 등 재난 현장은 계단, 잔해, 경사면 등 복잡한 3차원 구조물로 가득 차 있어 로봇의 자율 주행에 큰 어려움을 준다. 기존의 2차원 평면 기반 경로 계획 알고리즘은 이러한 환경에 적용하기 어렵다. 이 연구는 탐색 및 구조 임무를 수행하는 지상 로봇이 이러한 비정형 3D 환경에서 스스로 안전하고 효율적인 경로를 계획하고 실행할 수 있도록 하는 통합 자율 주행 프레임워크를 개발하는 것을 목표로 했다.40
-
방법론: 이 연구의 핵심은 인식, 계획, 제어에 이르는 전체 과정을 하나의 유기적인 시스템으로 통합한 데 있다. 먼저, 3D 레이저 스캐너 등으로 획득한 포인트 클라우드 데이터를 군집화하고 평면, 경사면 등으로 분할하여 환경을 이해한다. 다음으로, 분할된 3D 지도를 바탕으로 로봇의 동역학(예: 전복 안정성)과 기구학적 제약(예: 플리퍼의 가동 범위)을 고려하여 주행 가능한 영역을 분석하고, 이를 기반으로 최적의 3D 경로를 계획한다. 마지막으로, 계획된 경로를 따라 로봇이 실제로 움직일 수 있도록 모터와 플리퍼를 정밀하게 제어하는 모션 계획 및 실행 모듈을 구현했다.40
-
핵심 결과 및 학문적 기여: 연구팀은 실제 구조 훈련장, 소방용 비상 계단, 그리고 3D 경로 계획 능력을 시험하기 위해 특별히 제작된 비평면 테스트 환경 등에서 실험을 수행하여 제안된 프레임워크의 실효성을 성공적으로 입증했다.40 이 논문의 수상은 로봇 공학 커뮤니티가 부여하는 가치의 본질을 드러낸다. NeurIPS나 ICCV가 특정 알고리즘의 독창성이나 이론적 기여에 높은 가치를 두는 것과 달리, 로봇 공학에서는 아무리 뛰어난 개별 알고리즘이라도 실제 물리적 시스템에 통합되어 의미 있는 작업을 비정형 환경에서 강건하게 수행할 수 있음을 증명해야 최고의 성취로 인정받는다. 이 연구는 인식, 계획, 제어라는 로봇 공학의 각기 다른 구성 요소를 성공적으로 엮어내어 ’시스템 전체가 곧 기여(the system is the contribution)’임을 보여준 대표적인 사례이다. 이는 로봇 공학이 추상적인 알고리즘을 넘어 ’구현된 지능(embodied intelligence)’을 지향하는 학문임을 명확히 한다.41
4. 2013 IEEE 컴퓨터 비전 국제 학회 (ICCV 2013)의 시각 지능 연구
4.1 학회 개요 및 비전 연구의 최전선
2013년 12월 1일부터 8일까지 호주 시드니에서 개최된 IEEE 컴퓨터 비전 국제 학회(ICCV 2013)는 딥러닝이 컴퓨터 비전 분야에 가져온 혁명적인 변화가 본격적으로 확산되고 심화되는 양상을 뚜렷하게 보여주었다.46 AlexNet의 성공 이후, 대규모 데이터셋과 심층 신경망을 이용한 객체 인식 및 분류는 학회의 핵심 주제로 자리 잡았으며, 연구자들은 단순히 성능을 높이는 것을 넘어 모델의 작동 방식을 이해하고 그 적용 범위를 넓히려는 노력을 시작했다.
예를 들어, “HOGgles: Visualizing Object Detection Features“와 같은 연구는 당시 널리 사용되던 HOG(Histogram of Oriented Gradients) 특징 기반 객체 탐지 모델이 이미지의 어느 부분에 반응하여 결정을 내리는지를 시각화하는 기법을 제시했다.46 이는 모델의 예측을 해석하고 디버깅하려는 시도로, 오늘날 설명가능 AI(Explainable AI, XAI) 연구의 초기 형태로 볼 수 있다. 이 외에도 3D 장면 재구성, 의미론적 분할(semantic segmentation), 비디오 분석 등 컴퓨터 비전의 전통적인 핵심 문제들 전반에 걸쳐 딥러닝 기반의 새로운 접근법들이 제시되며 분야의 발전을 가속화했다. ICCV 2013은 딥러닝이라는 새로운 패러다임이 비전 연구의 ’표준’으로 자리 잡아가면서, 성능의 한계를 넓히는 동시에 그 내부를 들여다보고 응용의 지평을 넓히려는 탐구가 시작된 중요한 시점이었다.
4.2 마르상 (Marr Prize) 수상 논문 심층 분석: “From Large Scale Image Categorization to Entry-Level Categories”
컴퓨터 비전 분야 최고 영예인 마르상(Marr Prize)이 이 논문에 수여되었다는 사실은 당시 학계의 패러다임 전환을 상징하는 중요한 사건이다.50 이는 컴퓨터 비전의 궁극적인 평가 기준이 단순히 픽셀 수준의 분류 정확도를 넘어, 인간의 의미 체계 및 인지 과정과의 정렬(alignment)로 이동하고 있음을 시사했기 때문이다.
-
연구 목표 및 배경: 2013년 당시, ImageNet과 같은 대규모 데이터셋으로 훈련된 딥러닝 모델들은 ’시베리안 허스키’나 ’리스보아테리어’와 같이 수천 개의 세분화된, 전문가 수준의 카테고리를 놀라운 정확도로 분류할 수 있었다. 그러나 사람들은 일상에서 이러한 백과사전식 명칭 대신 ’개’나 ’강아지’와 같이 더 일반적이고 자연스러운 ’기본 수준 범주(entry-level category)’를 사용한다. 이 연구는 이처럼 기계가 생성하는 정밀한 레이블과 인간이 자연스럽게 사용하는 언어 사이의 의미론적 간극을 해소하고, 기계가 인간처럼 ‘자연스러운’ 이름으로 객체를 인식하고 명명하도록 만드는 것을 목표로 했다.54
-
방법론: 연구진은 다단계의 독창적인 접근법을 사용했다. 첫째, 아마존 메카니컬 터크(Amazon Mechanical Turk)를 통해 수백 개의 ImageNet 카테고리 이미지들을 사람들에게 보여주고, 그들이 자연스럽게 사용하는 이름(기본 수준 범주)을 직접 수집하여 그라운드 트루스 데이터를 구축했다. 둘째, 기계가 학습한 세분화된 카테고리(예:
n02110185, 시베리안 허스키)를 인간이 사용하는 기본 수준 범주(예: ‘dog’)로 ’번역’하는 모델을 학습했다. 이 과정에서 WordNet의 상하위어 계층 구조를 이용해 의미론적 거리를 측정하고, 구글 N-gram과 같은 웹 스케일 텍스트 코퍼스에서 추출한 단어 빈도수를 ’자연스러움’의 척도로 활용했다. 셋째, 주어진 이미지에 대해 최적의 기본 수준 범주를 예측하기 위해, (1) 대규모 이미지 분류기(수천 개의 SVM 분류기)의 출력 점수와 (2) 앞서 학습한 언어 기반 번역 모델의 점수를 결합하는 통합 모델을 제안했다.55 -
핵심 결과 및 학문적 기여: 이 연구는 컴퓨터 비전의 목표를 기계 중심의 분류 정확도 경쟁에서 벗어나, 인간의 인지 및 언어 사용 방식에 부합하는 ’인간 중심의 비전(human-centric vision)’이라는 새로운 차원으로 끌어올렸다.57 이는 시각 인식 시스템의 최종 결과물이 인간 사용자에게 얼마나 유용하고 자연스럽게 전달될 수 있는가를 중요한 평가 척도로 삼아야 한다는 점을 학계에 각인시켰다. 이 논문이 제시한 문제의식과 접근법, 즉 시각 정보와 언어 정보를 결합하여 인간의 상식과 유사한 수준의 이해를 추구하는 방향성은 이후 이미지 캡셔닝(Image Captioning), 시각적 질의응답(Visual Question Answering, VQA), 멀티모달 AI 연구의 폭발적인 성장을 이끄는 중요한 기폭제가 되었다. 즉, 이 연구는 대규모 인식을 그 자체의 목적이 아닌, 보다 인간 친화적인 AI 응용을 위한 수단으로 재정의하는 의미론적 전환점(Semantic Pivot)을 마련한 것이다.
-
핵심 개념: 제안된 통합 모델은 시각적 증거와 언어적 선호도를 결합한다. 이미지 I가 주어졌을 때, 선형 SVM 기반의 시각 모델은 각 타겟 단어 v_i에 대한 신뢰도 점수를 출력한다. 이 점수는 플랫 스케일링(Platt scaling)을 통해 확률값으로 변환될 수 있다.
F_{svm}(I, \Theta) = \frac{1}{1 - \exp(a\Theta^T X + b)}
여기서 X는 이미지로부터 추출된 특징 벡터이고, \Theta는 학습된 SVM 모델의 파라미터이다.55 최종 예측은 이 시각적 점수와, 특정 분류기 출력(예: ‘시베리안 허스키’)이 ’개’라는 단어로 번역될 언어적 확률을 결합하여 이루어진다.
5. 주요 학술지 발표 연구 동향
2013년 4분기에는 주요 학회 발표와 더불어, 해당 분야의 최고 권위 학술지에서도 장기적인 관점의 중요 연구들이 발표되며 학문적 깊이를 더했다.
5.1 Journal of Machine Learning Research (JMLR)
2013년 JMLR은 딥러닝의 실용적 성공이 확산되는 가운데서도, 기계학습의 근간을 이루는 이론적 토대를 견고히 하는 연구들을 꾸준히 조명했다.60 이는 빠르게 변화하는 트렌드 속에서도 학문적 엄밀함과 기초 이론의 중요성을 강조하는 JMLR의 역할을 보여준다.
-
주요 논문 분석: “Counterfactual Reasoning and Learning Systems: The Example of Computational Advertising”
-
내용: 2013년 11월에 발표된 이 논문은 Léon Bottou 등이 저술한 것으로, 검색 엔진의 광고 배치 시스템과 같이 복잡한 학습 시스템이 환경과 상호작용할 때 발생하는 근본적인 문제를 다룬다.64 시스템은 관측된 데이터(예: 사용자가 특정 광고를 클릭한 기록)를 기반으로 학습하지만, 정작 시스템 설계자가 알고 싶은 것은 “만약 우리가 다른 광고를 노출했다면, 사용자가 클릭했을까?“와 같은 ‘반사실적(counterfactual)’ 질문에 대한 답이다. 이 논문은 이러한 질문에 답하기 위해 인과 추론(causal inference)의 개념을 학습 시스템 분석에 도입하는 프레임워크를 제시했다.
-
의의: 이 연구는 단순히 관측 데이터의 상관관계에 기반한 예측 모델의 한계를 명확히 지적하고, 시스템의 행동 변화가 가져올 결과를 예측하기 위해서는 인과 관계에 대한 추론이 필수적임을 역설했다. 이는 기계학습 모델의 예측 성능을 넘어, 모델의 행동을 깊이 이해하고 신뢰할 수 있는 의사결정을 내리기 위한 중요한 이론적 전환을 의미했다. 특히 A/B 테스트가 불가능하거나 비윤리적인 상황에서 정책의 효과를 추정하는 오프-폴리시 평가(off-policy evaluation)와 같은 후속 연구에 큰 영향을 미쳤으며, 오늘날 강화학습, 추천 시스템, 공정성 연구 등에서 핵심적인 개념으로 자리 잡았다.
5.2 International Journal of Robotics Research (IJRR)
IJRR은 로봇 공학 분야의 최상위 학술지로서, 이 시기에도 로봇 공학의 핵심 이론과 실제 물리적 시스템 구현 사이의 간극을 메우는 수준 높은 연구들을 다수 게재했다.65
-
주요 논문 분석 1: “Reinforcement learning in robotics: A survey”
-
내용: Jens Kober, J. Andrew Bagnell, Jan Peters가 저술한 이 서베이 논문은 당시까지 로봇 공학 분야에 적용된 강화학습 연구를 포괄적으로 집대성하고 체계적으로 정리했다.23 논문은 강화학습을 로봇에 적용할 때 발생하는 핵심적인 도전 과제들(예: 고차원 상태/행동 공간, 샘플 비효율성)을 정의하고, 이를 해결하기 위한 다양한 접근법—알고리즘(모델 기반 대 모델-프리, 가치 함수 기반 대 정책 탐색), 표현(함수 근사), 사전 지식의 활용—을 깊이 있게 비교 분석했다.23
-
의의: 이 논문은 흩어져 있던 로봇 강화학습 연구들을 하나의 통일된 프레임워크 안에서 조망할 수 있는 기회를 제공함으로써, 해당 분야의 연구자들에게 중요한 길잡이 역할을 했다. 강화학습과 로봇 공학이라는 두 커뮤니티 사이의 학문적 소통을 촉진하고, 이후 딥러닝과 결합된 심층 강화학습(Deep Reinforcement Learning)이 로봇 조작 및 제어 분야에서 폭발적으로 성장하는 이론적, 개념적 토대를 마련했다는 점에서 기념비적인 논문으로 평가받는다.
-
주요 논문 분석 2: “Motion Planning with Sequential Convex Optimization and Convex Collision Checking” (TrajOpt)
-
내용: John Schulman 등이 제안한 TrajOpt는 로봇의 동작 계획(motion planning) 문제를 최적화의 관점에서 접근하는 새로운 프레임워크이다.70 이 방법은 비볼록(non-convex)이고 제약 조건이 많은 전체 경로 최적화 문제를, 국소적으로 볼록(convex)인 문제들의 연속으로 근사하여 푸는 ‘연속적 볼록 최적화(Sequential Convex Optimization, SCO)’ 기법을 사용한다. 특히, 로봇과 장애물 간의 충돌 회피 제약을 ’연속 시간상의 안전(continuous-time safety)’을 보장하는 효율적인 볼록 제약식으로 공식화하여, 충돌이 있는 부정확한 초기 경로로부터 시작하더라도 빠르고 안정적으로 충돌 없는 최적 경로를 찾아낼 수 있다.70
-
의의: TrajOpt는 당시 주류였던 샘플링 기반 경로 계획 방법론(예: RRT)의 단점(최적성 보장 부재, 후처리 필요 등)에 대한 강력한 대안을 제시했다. 최적화 기반 접근법이 복잡한 고차원 로봇 동작 계획 문제에 실용적으로 적용될 수 있음을 입증했으며, 특히 그 속도와 강건함은 실제 로봇 시스템에 적용될 가능성을 크게 높였다. 이 연구는 이후 로봇 동작 계획 분야에서 최적화 기반 방법론의 중요성을 재확인시키고, 관련 연구를 촉진하는 데 중요한 역할을 했다.
6. 결론: 2013년 4분기 연구 동향 종합 및 학문적 의의
2013년 4분기는 인공지능과 로봇 공학이 새로운 시대로 진입하는 중요한 길목이었다. 이 시기의 연구 동향을 종합하면 다음과 같은 네 가지 핵심적인 흐름을 발견할 수 있다. 첫째, 딥러닝 방법론의 심화 및 응용 확산이다. ICCV와 NeurIPS를 중심으로 딥러닝은 이미지 인식을 넘어 다양한 문제에 적용되기 시작했으며, 모델의 내부를 이해하려는 초기 시도들이 나타났다. 둘째, 데이터와 모델의 규모가 커짐에 따라 알고리즘의 확장성 확보가 핵심적인 공학적, 이론적 문제로 부상했다. NeurIPS의 수상 논문인 CONTINEST는 이러한 시대적 요구에 대한 명쾌한 해답 중 하나였다. 셋째, 기계의 출력을 인간의 인지 및 언어 모델과 정렬하려는 인간 중심 AI로의 전환이 시작되었다. ICCV 마르상 수상작인 ‘Entry-Level Categories’ 연구는 이 흐름을 상징적으로 보여주는 이정표였다. 마지막으로, 이러한 경험적 성공들을 뒷받침하고 미래의 발전을 이끌기 위한 기초 이론(최적화, 인과성, 메모리 이론, 강화학습)의 심화가 JMLR, IJRR, NeurIPS 등에서 꾸준히 이루어졌다.
이러한 흐름 속에서 비록 4분기 발표는 아니지만, 2013년 초 arXiv에 공개된 Mikolov 등의 “Efficient Estimation of Word Representations in Vector Space”, 즉 Word2Vec 논문은 이 시기 연구 지형에 막대한 영향을 미친 그림자 같은 존재였다.72 단어를 저차원의 밀집 벡터로 표현하는 이 아이디어는 자연어 처리(NLP) 분야에 혁명을 일으켰고, 그 영향력은 NeurIPS 2013에서 발표된 “Distributed Representations of Words…“와 같은 후속 연구들을 통해 명확히 확인할 수 있었다.4 당시 Word2Vec에 대해 “이미 알고 있던 아이디어“라는 반응부터 “작동할 리 없는 해킹“이라는 회의적인 시선까지 다양한 평가가 공존했다는 사실은 76, 하나의 혁신적인 패러다임이 학계에 수용되고 정착하는 과정의 역동성을 생생하게 보여준다.
결론적으로, 2013년 4분기에 제시된 연구들은 각기 다른 방향을 향하는 것처럼 보이지만, 실제로는 상호 보완적으로 현재 AI 시대의 청사진을 그리고 있었다. 확장 가능한 학습 알고리즘, 인간과 AI의 의미론적 정렬, 시스템의 행동을 이해하기 위한 인과 추론, 그리고 물리 세계와 상호작용하기 위한 로봇 강화학습 및 동작 계획 이론은 모두 오늘날 우리가 목도하고 있는 생성 AI, 대형 언어 모델(LLM), 그리고 자율 로봇 기술의 직접적인 초석이 되었다. 따라서 이 시기는 단순한 과거의 한 지점이 아니라, 현재 인공지능 혁명의 근간을 이룬 아이디어들이 잉태되고 구체화된 결정적인 순간으로 평가되어야 한다.
| 학회 (Conference) | 상 (Award) | 논문 제목 (Paper Title) | 저자 (Authors) |
|---|---|---|---|
| NeurIPS 2013 | Outstanding Paper | A memory frontier for complex synapses | Subhaneil Lahiri, Surya Ganguli |
| NeurIPS 2013 | Outstanding Paper | Submodular Optimization with Submodular Cover and Submodular Knapsack Constraints | Rishabh Iyer, Jeff Bilmes |
| NeurIPS 2013 | Outstanding Paper | Scalable Influence Estimation in Continuous-Time Diffusion Networks | Nan Du, Le Song, Manuel Gomez-Rodriguez, Hongyuan Zha |
| ICCV 2013 | Marr Prize | From Large Scale Image Categorization to Entry-Level Categories | Vicente Ordonez, Jia Deng, Yejin Choi, Alexander C. Berg, Tamara L. Berg |
| IROS 2013 | RoboCup Best Paper | 3D Path Planning and Execution for Search and Rescue Ground Robots | Francis Colas, Srivatsa Mahesh, François Pomerleau, Ming Liu, Roland Siegwart |
7. 참고 자료
- neurips.cc, https://neurips.cc/Conferences/2013/Dates#:~:text=The%20Twenty%2DSeventh%20annual%20conference,at%20the%20Harrahs%20and%20Harveys.
- 2013 Dates and Deadlines - NeurIPS 2025, https://neurips.cc/Conferences/2013/Dates
- 2013 Conference - NeurIPS 2025, https://neurips.cc/Conferences/2013
- What were the scientific highlights of NIPS 2013? - Quora, https://www.quora.com/What-were-the-scientific-highlights-of-NIPS-2013
- NIPS 2013 Awards - NeurIPS 2025, https://neurips.cc/Conferences/2013/Awards
- A memory frontier for complex synapses - Neural Dynamics and …, https://ganguli-gang.stanford.edu/pdf/Synapse.NIPS14.pdf
- Subhaneil Lahiri, https://subhylahiri.github.io/files/cv.pdf
- (PDF) Computational models of learning and synaptic plasticity - ResearchGate, https://www.researchgate.net/publication/386576655_Computational_models_of_learning_and_synaptic_plasticity
- Continual Learning by Maximizing Transfer and Minimizing Interference - Marc Pickett, https://marcpickett.com/cl2018/CL-2018_paper_78.pdf
- Bilmes and Iyer Win Best Paper at the 2013 Neural Information Processing Systems Conference - UW Department of Electrical & Computer Engineering - University of Washington, https://www.ece.uw.edu/spotlight/bilmes-and-iyer-win-best-paper-at-the-2013-neural-information-processing-systems-conference/
- Submodular Optimization with Submodular Cover and Submodular …, https://people.ece.uw.edu/bilmes/p/mypubs/rishabh2013-submodular-constraints.pdf
- Practical Parallel Algorithms for Submodular Maximization Subject to a Knapsack Constraint with Nearly Optimal Adaptivity | Request PDF - ResearchGate, https://www.researchgate.net/publication/371924906_Practical_Parallel_Algorithms_for_Submodular_Maximization_Subject_to_a_Knapsack_Constraint_with_Nearly_Optimal_Adaptivity
- Nonmonontone submodular maximization under routing constraints | Request PDF, https://www.researchgate.net/publication/365889684_Nonmonontone_submodular_maximization_under_routing_constraints
- A Polynomial Lower Bound on the Number of Rounds for Parallel Submodular Function Minimization and Matroid Intersection | SIAM Journal on Computing, https://epubs.siam.org/doi/abs/10.1137/22M147685X
- Scalable Influence Estimation in Continuous-Time Diffusion … - NIPS, https://proceedings.neurips.cc/paper/2013/file/8fb21ee7a2207526da55a679f0332de2-Paper.pdf
- Influence Maximization in Social Networks: A Survey - arXiv, https://arxiv.org/pdf/2309.04668
- (PDF) Influence Maximization under Fairness Budget Distribution in Online Social Networks, https://www.researchgate.net/publication/365282682_Influence_Maximization_under_Fairness_Budget_Distribution_in_Online_Social_Networks
- Influence Maximization under Fairness Budget Distribution in Online Social Networks - MDPI, https://www.mdpi.com/2227-7390/10/22/4185
- Papers - Le Song, https://dasongle.github.io/papers.html
- www.active-fp7.eu, https://www.active-fp7.eu/index.php/congress/112-iros-2013.html
- IEEE/RSJ IROS2013 | Home, https://ewh.ieee.org/soc/ras/conf/financiallycosponsored/IROS/2013/www.iros2013.org/index.html
- 2013 IEEE/RSJ International Conference on Intelligent Robots and Systems, Tokyo, Japan, November 3-7, 2013 - researchr publication, https://researchr.org/publication/iros-2013
- Reinforcement Learning in Robotics: A Survey, https://www.ri.cmu.edu/pub_files/2013/7/Kober_IJRR_2013.pdf
- IEEE/RSJ IROS2013 | Awards, https://ewh.ieee.org/soc/ras/conf/financiallycosponsored/IROS/2013/www.iros2013.org/awards.html
- IROS 2013, https://sites.cc.gatech.edu/fac/Frank.Dellaert/FrankDellaert/Frank_Dellaert/Entries/2013/11/3_IROS_2013.html
- Awards - ICRA 2013, https://www.icra2013.org/index14cc.html?page_id=153
- Joseph Del Preto, SEAS 2013, wins Best Paper Award award at IROS 2014 - CRLab - Columbia Robotics Lab, http://crlab.cs.columbia.edu/posts/2014/09/joseph-preto-best-paper-award/
- Best Paper Awards - Carnegie Mellon University, https://ml.cmu.edu/honors-and-awards/best-paper-awards
- IROS 2023 Award Winners, https://2023.ieee-iros.org/iros-2023-award-winners/
- INTELLIGENT ROBOTS AND SYSTEMS. IEEE/RSJ INTERNATIONAL CONFERENCE. 2013. (IROS 2013) (DVD) - proceedings.com, https://www.proceedings.com/20610.html
- Best Paper Award - IROS 2019 - Macau, https://www.iros2019.org/awards
- IROS Best Paper Award on Mobile Manipulation | Electrical and Computer Engineering, https://ece.ucsd.edu/awards/faculty/iros-best-paper-award-mobile-manipulation
- Néstor Pérez-Arancibia | Facility, Operations & Safety Services, https://vcea.wsu.edu/foss/vcea-shops/wsu-profile/n.perezarancibia/
- ewh.ieee.org, https://ewh.ieee.org/soc/ras/conf/financiallycosponsored/IROS/2013/www.iros2013.org/bspaward.html#:~:text=Satoshi%20Tadokoro%2C%20Tohoku%20Univ.
- Best Student Paper Award - IEEE/RSJ IROS2013, https://ewh.ieee.org/soc/ras/conf/financiallycosponsored/IROS/2013/www.iros2013.org/bspaward.html
- Awards | ICRA 2013, https://ewh.ieee.org/soc/ras/conf/fullysponsored/icra/2013/index14cc.html?page_id=153
- Awards and Finalists - IEEE ICRA 2025, https://2025.ieee-icra.org/program/awards-and-finalists/
- News and Press - George J. Pappas, https://www.georgejpappas.org/news-and-press/
- IROS RoboCup Best Paper Award, https://www.robocup.org/iros_robocup_best_paper_award
- (PDF) Real-time Autonomous 3D Navigation for Tracked Vehicles in …, https://www.researchgate.net/publication/265206625_Real-time_Autonomous_3D_Navigation_for_Tracked_Vehicles_in_Rescue_Environments
- Path Planning for Autonomous Mobile Robots: A Review - MDPI, https://www.mdpi.com/1424-8220/21/23/7898
- Energy-Optimized 3D Path Planning for Unmanned Aerial Vehicles - MDPI, https://www.mdpi.com/2076-3417/14/16/6988
- RGBD-Inertial Trajectory Estimation and Mapping for Ground Robots - MDPI, https://www.mdpi.com/1424-8220/19/10/2251
- RGBD-Inertial Trajectory Estimation and Mapping for Ground Robots - OUCI, https://ouci.dntb.gov.ua/en/works/426G5Qw4/
- A Planning Framework Based on Semantic Segmentation and Flipper Motions for Articulated Tracked Robot in Obstacle-Crossing Terrain - MDPI, https://www.mdpi.com/2313-7673/10/9/627
- 2013 IEEE International Conference on Computer Vision (ICCV), https://www.computer.org/csdl/proceedings/iccv/2013/12OmNyFCvPo
- COMPUTER VISION. IEEE INTERNATIONAL CONFERENCE. 2013. (ICCV 2013) (4 VOLS), https://www.proceedings.com/21578.html
- ICCV 2013 : IEEE International Conference on Computer Vision - WikiCFP, http://www.wikicfp.com/cfp/servlet/event.showcfp?eventid=18583
- Home - iccv2013, https://cbs.ic.gatech.edu/Home%20-%20iccv2013.htm
- ICCV Paper Awards - IEEE Computer Society Technical Committee on Pattern Analysis and Machine Intelligence, https://tc.computer.org/tcpami/awards/iccv-paper-awards/
- ICCV 2013 Awards and Voting - The Computer Vision Foundation, https://www.thecvf.com/?p=84
- Awards - iccv2013 - Rice University, https://www.cs.rice.edu/~vo9/files/marrprize.htm
- Awards - IEEE Computer Society Technical Committee on Pattern Analysis and Machine Intelligence, https://tc.computer.org/tcpami/awards/
- Computational Visual Recognition, https://acberg.com/tenure/berg_rs_2015_tenure.pdf
- From Large Scale Image Categorization to Entry-Level Categories, https://www.cs.princeton.edu/~jiadeng/paper/naming_iccv2013.pdf
- From Large Scale Image Categorization to Entry-Level Categories - Tamara L Berg, http://www.tamaraberg.com/papers/entrylevel.pdf
- Vicente Ordóñez-Román - SAP, https://assets.dm.ux.sap.com/de-machine-learning-research-retreat2018/pdfs/feedback-munich.pdf
- Toward a General Framework for Words & Pictures - Tamara L Berg, https://tamaraberg.com/grants/career.html
- Vicente Ord ´o ˜nez-Rom án (publishes as Vicente Ordonez) - Rice University, https://www.cs.rice.edu/~vo9/cv_vicente.pdf
- Journal of Machine Learning Research (JMLR), https://www.jmlr.org/
- JMLR Papers - Journal of Machine Learning Research, https://jmlr.org/papers
- JMLR Volume 14 - Journal of Machine Learning Research, https://www.jmlr.org/papers/v14
- JMLR Papers - Journal of Machine Learning Research, https://jmlr.csail.mit.edu/papers/
- Counterfactual Reasoning and Learning Systems: The Example of Computational Advertising, https://jmlr.org/papers/volume14/bottou13a/bottou13a.pdf
- The International Journal of Robotics Research (SAGE Publishing) | 2762 Publications | 60772 Citations | Top authors - SciSpace, https://scispace.com/journals/the-international-journal-of-robotics-research-3rqyvl4i
- Top 94 The International Journal of Robotics Research papers published in 2013, https://scispace.com/journals/the-international-journal-of-robotics-research-3rqyvl4i/2013
- (PDF) Reinforcement Learning in Robotics: A Survey - ResearchGate, https://www.researchgate.net/publication/258140920_Reinforcement_Learning_in_Robotics_A_Survey
- Reinforcement learning in robotics: A survey - Bohrium, https://www.bohrium.com/paper-details/reinforcement-learning-in-robotics-a-survey/813202959688007681-0
- Reinforcement learning in robotics: A survey - Semantic Scholar, https://www.semanticscholar.org/paper/Reinforcement-learning-in-robotics%3A-A-survey-Kober-Bagnell/65438e0ba226c1f97bd8a36333ebc3297b1a32fd
- Robotics Research The International Journal of - People @EECS, https://people.eecs.berkeley.edu/~pabbeel/papers/2014-IJRR-trajopt.pdf
- Motion Planning with Sequential Convex Optimization and Convex …, https://rll.berkeley.edu/trajopt/ijrr/2013-IJRR-TRAJOPT.pdf
- Efficient Estimation of Word Representations in Vector Space, https://arxiv.org/abs/1301.3781
- Efficient Estimation of Word Representations in Vector Space - ResearchGate, https://www.researchgate.net/publication/319770439_Efficient_Estimation_of_Word_Representations_in_Vector_Space
- Mikolov, T., Chen, K., Corrado, G. and Dean, J. (2013) Efficient Estimation of Word Representations in Vector Space. ArXiv 1301.3781. - References - Scientific Research Publishing, https://www.scirp.org/reference/referencespapers?referenceid=3400424
- (PDF) Efficient Estimation of Word Representations in Vector Space - ResearchGate, https://www.researchgate.net/publication/234131319_Efficient_Estimation_of_Word_Representations_in_Vector_Space
- Word2Vec received ‘strong reject’ four times at ICLR2013 - Hacker News, https://news.ycombinator.com/item?id=38684925
- Word2Vec | Natural Language Engineering | Cambridge Core, https://www.cambridge.org/core/journals/natural-language-engineering/article/word2vec/B84AE4446BD47F48847B4904F0B36E0B