년 10월 인공지능 및 로봇 연구 동향
1. 2022년 10월 AI 및 로봇공학 연구 지형 개관
2022년 10월은 인공지능(AI) 연구의 패러다임이 전환되는 중요한 분기점으로 기록된다. 이 시기는 대규모 기반 모델(Foundation Models)의 영향력이 생성(Generation), 과학적 발견(Scientific Discovery), 그리고 전략적 상호작용(Strategic Interaction)이라는 세 가지 핵심 축으로 발현되며 기술의 지형도를 근본적으로 재편했다.1 개별 기술의 점진적 발전을 넘어, 서로 다른 분야의 연구들이 거대 모델이라는 공통된 기반 위에서 융합되고 상호작용하며 새로운 가능성을 창출한 변곡점이었다.
이 시기의 주요 연구 동향은 다음과 같이 요약할 수 있다. 첫째, 생성 모델 분야에서는 확산 모델(Diffusion Models)이 Text-to-Image 및 Video 생성에서 최첨단(State-of-the-Art, SOTA) 성능을 달성하며 새로운 표준으로 부상했다.1 둘째, 과학적 발견의 영역에서는 DeepMind의 AlphaTensor가 50년 된 수학 난제인 행렬 곱셈 알고리즘을 발견함으로써, AI가 인간의 직관을 넘어 새로운 과학적 지식을 창출하는 도구로 진화할 수 있음을 입증했다. 셋째, 인간-AI 상호작용 분야에서는 Meta AI의 CICERO가 복잡한 협상 게임 ’외교(Diplomacy)’에서 인간 수준의 성능을 보이며, AI가 단순한 도구를 넘어 사회적, 전략적 맥락에서 인간과 협력하는 파트너가 될 가능성을 제시했다. 마지막으로, IROS, CoRL 등 주요 로봇공학 학회에서는 이러한 AI의 발전이 어떻게 물리 세계와 상호작용하는 로봇의 지능, 즉 체화된 지능(Embodied AI)으로 연결되는지를 구체적으로 보여주었다.3
이러한 주요 연구 성과들은 개별적인 돌파구가 아니라, ’규모의 경제(Economics of Scale)’가 AI 연구의 핵심 동력으로 자리 잡았음을 보여주는 상호 연결된 현상으로 해석해야 한다. AlphaTensor는 대규모 강화학습의 산물이며 6, CICERO는 27억 개의 파라미터를 가진 대규모 언어 모델을 핵심 구성 요소로 사용한다.7 또한, Imagen과 같은 확산 모델의 성공은 대규모 언어 모델(T5)을 텍스트 인코더로 활용한 것에 크게 기인한다.8 이 세 가지 핵심 연구 모두 ’대규모 사전학습 모델’이라는 공통 분모를 가지며, 이는 모델 아키텍처 자체의 혁신만큼이나 모델의 크기와 학습 데이터의 양이 성능을 결정하는 핵심 변수가 되었음을 시사한다. 이는 AI 연구의 패러다임이 ’모델 중심(Model-centric)’에서 ’데이터 및 컴퓨팅 중심(Data- and Compute-centric)’으로 이동하고 있음을 의미한다. 결과적으로, Meta의 Grand Teton과 같은 AI 전용 하드웨어 인프라에 대한 투자와 PyTorch 재단 설립 같은 생태계 구축 노력은 단순한 기술 지원을 넘어, 연구의 방향성을 결정하는 필수불가결한 요소가 되었다.9 이는 AI 기술 발전이 소수의 거대 기술 기업에 의해 주도될 수밖에 없는 구조적 특징을 심화시키는 측면도 내포한다.
본 보고서는 이러한 핵심 연구들을 심층 분석하고, 이들이 기술적, 산업적, 정책적으로 가지는 함의를 다각적으로 조명하여 2022년 10월의 연구 지형을 입체적으로 재구성하고자 한다.
2. 생성 모델의 패러다임 전환: 확산 모델의 부상 (NeurIPS 2022 중심)
2022년 하반기는 생성 모델 분야에서 확산 모델이 기존의 생성적 적대 신경망(GAN)을 넘어서는 성능을 입증하며 새로운 패러다임의 주역으로 부상한 시기였다. 특히 NeurIPS 2022를 전후하여 발표된 연구들은 확산 모델의 이론적 깊이와 응용 가능성을 동시에 확장했다.
2.1 확산 모델의 이론적 배경
확산 모델의 핵심 원리는 정제된 데이터에 점진적으로 가우시안 노이즈를 추가하여 순수 노이즈 상태로 만드는 순방향 프로세스(forward process)와, 이 과정을 역으로 거슬러 올라가 노이즈로부터 원본 데이터를 점진적으로 복원하는 역방향 프로세스(reverse process)를 학습하는 것이다.10
수학적으로 순방향 프로세스는 점진적인 노이즈 추가 과정을 나타내며, 시간 t에서의 데이터 z_t는 원본 데이터 x로부터 다음과 같은 정규 분포를 따른다고 정의된다.
q(z_t|x) = \mathcal{N}(z_t; \alpha_t x, \sigma_t^2 I)
여기서 \alpha_t와 \sigma_t는 노이즈 스케줄을 결정하는 계수다. 모델의 학습 목표는 이 과정을 역으로 수행하는, 즉 z_t가 주어졌을 때 z_{t-1}을 예측하는 역방향 프로세스 p_\theta(z_{t-1}|z_t)를 학습하는 것이다. 이는 주로 z_t에서 원본 데이터 x를 예측하는 노이즈 제거(denoising) 목적 함수를 최소화하는 방식으로 이루어진다.10
\mathbb{E}_{\mathbf{x}, c, \boldsymbol{\epsilon}, t}\left[w_{t}\left\|\mathbf{x}_{\theta}\left(\alpha_{t} \mathbf{x}+\sigma_{t} \boldsymbol{\epsilon}, c\right)-\mathbf{x}\right\|_{2}^{2}\right]
이러한 확산 모델은 데이터 분포의 로그 확률 밀도 기울기, 즉 점수 함수(\nabla_x \log p(x))를 추정하는 점수 기반 생성 모델(score-based generative models)의 한 형태로 해석될 수 있다.14 점수 함수는 데이터 밀도가 높은 방향을 가리키는 벡터 필드를 형성하며, 모델은 이 벡터 필드를 따라 노이즈 샘플을 데이터 분포의 고밀도 영역으로 이동시켜 고품질의 샘플을 생성한다.
2.2 조건부 생성 및 품질 향상 기법
확산 모델의 폭발적인 성장을 이끈 핵심 기술 중 하나는 조건부 생성의 품질을 획기적으로 향상시킨 Classifier-Free Guidance (CFG)이다.8 CFG는 별도의 분류기 모델 없이 생성 모델 자체만을 사용하여 가이던스를 제공함으로써, 훈련 비용을 절감하고 성능을 개선했다.17
CFG의 작동 원리는 훈련 시 일정 확률(예: 10%)로 텍스트 프롬프트와 같은 조건(c)을 의도적으로 제거하여, 모델이 조건부 예측(\epsilon_\theta(z_t, c))과 비조건부 예측(\epsilon_\theta(z_t))을 모두 학습하도록 하는 것이다. 샘플링 단계에서는 이 두 예측값을 다음과 같이 조합하여 조건의 방향으로 예측을 강화(외삽, extrapolate)한다.13
\tilde{\mathbf{\epsilon}}_{\theta}(\mathbf{z}_t, c) = \epsilon_{\theta}(\mathbf{z}_t) + w(\epsilon_{\theta}(\mathbf{z}_t, c) - \epsilon_{\theta}(\mathbf{z}_t))
여기서 w는 가이던스 강도(guidance scale)를 조절하는 하이퍼파라미터로, 값이 클수록 생성된 이미지는 주어진 텍스트 프롬프트와 더 강하게 정렬된다.
CFG의 성공은 생성 모델 제어 패러다임의 근본적인 변화를 시사한다. 초기 가이던스 기법은 별도의 분류기를 훈련시켜 그 그래디언트를 샘플링 과정에 주입하는 ‘외재적 제어’ 방식에 의존했다.18 이는 추가적인 모델 훈련 비용과 노이즈가 낀 데이터에 대한 분류기 성능 저하 문제를 야기했다. 반면, CFG는 이러한 외부 의존성을 제거하고, 단일 모델 내에서 조건부와 비조건부 예측의 차이를 활용하여 ’의미론적 방향 벡터’를 내부적으로 계산하는 ‘내재적 제어’ 방식을 구현했다.18 이 내재적 제어 방식은 훨씬 더 유연하고 효율적이며, 향후 멀티모달리티, 다중 개념 결합, 스타일 제어 등 복잡하고 미세한 수준의 제어가 요구되는 생성 AI 기술의 기반이 될 것이다. 이는 생성 모델이 단순한 ’생성기’에서 상호작용 가능한 ’창작 도구’로 발전하는 데 결정적인 역할을 한다.
2.3 응용 분야 확장
Google Research의 Imagen 모델은 이러한 기술 발전의 정점을 보여주는 사례다. Imagen은 대규모 언어 모델(T5)을 텍스트 인코더로 사용하고, 효율적인 U-Net 아키텍처와 동적 임계값(dynamic thresholding) 같은 새로운 샘플링 기법을 결합하여, COCO 데이터셋에서 당시 SOTA FID 점수인 7.27을 달성했다.8
이미지 생성에서의 성공을 바탕으로, 연구는 시간적 일관성을 고려한 비디오 생성으로 빠르게 확장되었다. 표준 이미지 확산 아키텍처를 비디오 데이터에 맞게 확장하고, 이미지와 비디오 데이터를 함께 훈련하여 최적화를 가속하는 접근법이 제시되었다.10 또한, 조건부 생성 능력을 활용하여 이미지 분할, 초해상도, 이미지 편집 등 다양한 컴퓨터 비전 문제에 확산 모델을 플러그 앤 플레이 모듈처럼 활용할 수 있는 가능성도 활발히 탐구되었다.11
3. 과학적 발견을 가속하는 인공지능: AlphaTensor 사례 연구
2022년 10월, DeepMind는 Nature에 발표한 논문을 통해 AI 시스템 AlphaTensor가 50년 이상 정체되어 있던 수학적 난제인 행렬 곱셈 알고리즘을 개선했음을 발표했다. 이는 AI가 기존 지식을 학습하고 적용하는 단계를 넘어, 인간의 직관을 뛰어넘는 새로운 과학적 발견을 이끌어낼 수 있음을 보여준 상징적인 사건이다.
3.1 문제 정의: 행렬 곱셈의 계산 복잡성
행렬 곱셈은 신경망 훈련, 과학 컴퓨팅, 컴퓨터 그래픽스 등 광범위한 분야에서 사용되는 핵심적인 연산이다.6 두 n \times n 행렬을 곱하는 표준 알고리즘의 계산 복잡도는 O(n^3)이다. 1969년, Volker Strassen은 이를 O(n^{\log_2 7}) \approx O(n^{2.81})으로 개선하는 알고리즘을 발견했으나, 이후 반세기 동안 이론적 한계에 대한 근본적인 발전은 더디게 진행되었다.6
3.2 핵심 방법론: 강화학습 기반 텐서 분해
AlphaTensor의 핵심 아이디어는 행렬 곱셈 알고리즘 탐색 문제를 3차원 텐서(tensor)의 분해 문제로 재정의하는 것이다. 행렬 곱셈 연산은 T_n이라는 고유한 3차원 텐서로 표현될 수 있다. 이 텐서를 최소 개수(R)의 순위-1 텐서(rank-one tensors)의 합으로 분해하는 것은, 곧 곱셈 연산 횟수가 R번인 가장 효율적인 알고리즘을 찾는 것과 동일하다.21
T_n = \sum_{r=1}^{R} \mathbf{u}^{(r)} \otimes \mathbf{v}^{(r)} \otimes \mathbf{w}^{(r)}
DeepMind는 이 텐서 분해 과정을 ’TensorGame’이라는 싱글 플레이어 게임으로 모델링했다. 게임의 상태(state)는 분해해야 할 나머지 텐서 S_t이고, 행동(action)은 세 벡터 \mathbf{u}, \mathbf{v}, \mathbf{w}를 선택하여 순위-1 텐서를 현재 상태에서 빼는 것이다. 게임의 목표는 최소한의 행동으로 목표 텐서를 0으로 만드는 것이다.21
S_t \leftarrow S_{t-1} - \mathbf{u}^{(t)} \otimes \mathbf{v}^{(t)} \otimes \mathbf{w}^{(t)}
이 게임을 플레이하기 위해 AlphaZero에 기반한 심층 강화학습 에이전트 AlphaTensor가 개발되었다. 이 에이전트는 몬테카를로 트리 탐색(MCTS)을 사용하여 10^{12}개가 넘는 거대한 행동 공간을 효율적으로 탐색하고, 신경망을 통해 최적의 수를 예측하도록 훈련되었다.23
3.3 주요 결과 및 의의
AlphaTensor는 수많은 새로운 행렬 곱셈 알고리즘을 발견했다. 특히 유한체(finite field, modulo 2) 상에서 4 \times 4 행렬을 곱할 때, Strassen의 알고리즘(49회 곱셈)보다 효율적인 47회 곱셈의 알고리즘을 발견했다.20 또한, 다양한 크기의 행렬에 대해 기존의 가장 효율적인 알고리즘들을 재발견하고 개선했다.6
더 나아가, AlphaTensor는 특정 하드웨어(NVIDIA V100 GPU, Google TPU v2)에서의 실제 실행 시간(runtime)을 보상 함수에 포함시켜 훈련함으로써, 기존 라이브러리보다 10-20% 더 빠른 맞춤형 알고리즘을 생성하는 유연성을 보여주었다.6 이는 이론적 최적화를 넘어 실용적 가치를 창출할 수 있음을 입증한 것이다. 또한, 단일 최적해가 아닌 수천 개의 다양한 SOTA 알고리즘을 발견함으로써 행렬 곱셈 알고리즘의 공간이 이전에 알려진 것보다 훨씬 풍부함을 보여주었다.6
| 행렬 크기 (Matrix Size) | 연산 필드 / 하드웨어 (Field / Hardware) | 기존 최선 알고리즘 (곱셈 횟수) | AlphaTensor 발견 알고리즘 (곱셈 횟수) | 개선 사항 (Improvement) |
|---|---|---|---|---|
| 4 \times 4 | Modulo 2 | Strassen (49) | AlphaTensor (47) | 2회 곱셈 감소 |
| 4 \times 5 \times 5 \times 5 | Standard | Human-derived (80) | AlphaTensor (76) | 4회 곱셈 감소 |
| Large Matrices | NVIDIA V100 | Standard Library | AlphaTensor | 10-20% 더 빠른 실행 시간 |
| Large Matrices | Google TPU v2 | Standard Library | AlphaTensor | 10-20% 더 빠른 실행 시간 |
AlphaTensor의 가장 심대한 영향은 특정 알고리즘의 발견을 넘어, ’알고리즘 발견’이라는 프로세스 자체를 자동화하고 최적화할 수 있는 새로운 과학적 방법론을 제시했다는 점이다. 이는 AI가 인간 지식의 소비자를 넘어 생산자가 되는 패러다임 전환의 신호탄이다. AlphaTensor는 단순히 정해진 규칙 내에서 최적의 전략을 찾는 게임 AI(예: AlphaGo)를 넘어, 게임의 규칙 자체, 즉 ’계산하는 방법’을 찾는다. 하드웨어별 최적화 기능은 이 방법론의 일반성을 보여준다.6 보상 함수를 바꾸는 것만으로 최적화 목표(이론적 효율성, 실제 속도, 에너지 소비, 수치 안정성 등)를 유연하게 변경할 수 있기 때문이다. 이는 미래의 컴퓨팅 시스템이 ’범용 알고리즘’을 실행하는 대신, 특정 하드웨어 아키텍처와 문제에 대해 AI가 ’실시간으로 생성한 맞춤형 알고리즘’을 실행하는 시대로 나아갈 수 있음을 시사한다. 이는 반도체 설계, 컴파일러 최적화, 과학 컴퓨팅 등 전산 과학의 모든 분야에 근본적인 변화를 가져올 수 있는 잠재력을 가진다. 즉, 소프트웨어와 하드웨어의 공동 설계(Co-design)가 자동화되는 미래를 예고한다.
4. 인간과 기계의 전략적 상호작용: CICERO의 언어적 협상 능력
AI 연구의 또 다른 중요한 이정표는 Meta AI가 개발한 CICERO 에이전트가 제시했다. CICERO는 인간의 언어, 전략, 사회적 상호작용이 복잡하게 얽힌 게임 ’외교(Diplomacy)’에서 인간 수준의 성능을 달성함으로써, AI가 고도로 사회적인 맥락에서 인간과 협력하고 경쟁할 수 있는 가능성을 열었다.
4.1 문제 정의: 외교(Diplomacy) 게임의 복잡성
’외교’는 7명의 플레이어가 20세기 초 유럽의 강대국이 되어 대화와 협상을 통해 동맹을 맺고, 때로는 배신하며 유럽 대륙의 패권을 다투는 전략 게임이다.28 체스나 바둑과 같은 완전 정보, 제로섬 게임과 달리, ’외교’는 불완전 정보 게임이며, 승리를 위해서는 전술적 움직임뿐만 아니라 자연어 대화를 통한 신뢰 구축, 동맹 형성, 설득, 기만이 필수적이다. 이는 기존 AI 연구의 벤치마크와는 질적으로 다른 차원의 도전을 제기한다.29
4.2 CICERO 아키텍처: 언어 모델과 전략적 추론의 통합
CICERO의 성공은 두 가지 핵심 AI 기술, 즉 전략적 추론 엔진과 대규모 언어 모델을 성공적으로 통합한 데 있다.29
-
전략적 추론 엔진: 이 엔진은 현재 게임 보드 상태와 플레이어 간의 대화 내용을 종합적으로 분석하여 다른 플레이어들의 의도와 다음 행동을 모델링한다.
piKL이라는 반복적 계획 알고리즘을 사용하여, 자신을 포함한 모든 플레이어에게 이익이 되는 공동 계획을 수립한다.7 이 엔진은 순수한 합리성에 기반한 최적의 수와 인간 플레이어들이 선호할 만한 수 사이에서 균형을 맞추도록 설계되었다. -
제어 가능한 대화 모델: 27억 개의 파라미터를 가진 BART 기반 언어 모델을 기반으로 하며, 전략 엔진이 수립한 ’의도(intent)’에 부합하는 대화를 생성하도록 정교하게 제어된다.7 이는 단순히 문법적으로 맞는 문장을 생성하는 것을 넘어, 동맹 제안, 위협, 설득 등 전략적 목표를 달성하기 위한 목적 지향적 커뮤니케이션을 가능하게 한다.29
4.3 온라인 리그에서의 성과 및 의미
CICERO는 2022년 8월부터 10월까지 온라인 외교 리그(webDiplomacy.net)에서 익명으로 40개의 게임에 참여하여 그 성능을 검증받았다.28 그 결과, 인간 플레이어 평균 점수의 2배 이상을 획득했으며, 2회 이상 참여한 플레이어 중 상위 10%에 해당하는 뛰어난 성적을 거두었다.28 이는 AI가 복잡한 자연어 협상 및 전략 게임에서 인간 수준의 성능에 도달했음을 최초로 입증한 사례이다. CICERO의 성공은 AI가 예측 불가능하고 개방된 사회적 환경에서 인간과 효과적으로 상호작용하고 협력할 수 있는 잠재력을 보여준다. 이는 미래의 인간-AI 팀 구성, 자율 협상 에이전트, 사회적 로봇 등의 기술 개발에 중요한 시사점을 제공한다.
그러나 CICERO는 AI의 ’의도’와 인간의 ‘인식’ 사이에 심각한 괴리가 존재할 수 있다는 중요한 질문을 제기한다. CICERO는 현재 계획을 정직하게 전달하도록 설계되었지만, 게임 중 전략적 판단에 따라 계획을 변경할 수 있어 결과적으로 인간 플레이어에게는 배신처럼 보일 수 있다.7 실제로 한 후속 연구에서는 인간 플레이어들이 CICERO를 봇으로 쉽게 탐지하고, 인간보다 거짓말을 더 많이 한다고 인식했다고 보고했다.33 이러한 인식의 괴리는 AI의 커뮤니케이션 스타일(예: 지나치게 합리적이거나, 인간의 미묘한 사회적 신호를 놓침)과 인간의 편견(상대가 봇일 것이라는 선입견)이 복합적으로 작용한 결과일 수 있다. AI는 ’사실’에 기반한 계획을 말하지만, 인간은 그 말의 ’맥락’과 ’숨은 의도’를 다르게 해석하는 것이다. 이는 미래의 협력적 AI 시스템이 단순히 목표를 효율적으로 달성하는 것을 넘어, 인간 파트너에게 자신의 의도와 계획 변경의 이유를 ’설명’하고, 오해를 적극적으로 해소하며, 신뢰를 ’관리’하는 능력을 갖추어야 함을 의미한다. 즉, ’설명가능 AI(XAI)’가 기술적 투명성을 넘어 ’사회적 관계’의 영역으로 확장되어야 할 필요성을 제기하며, AI의 성능 평가 지표가 단순히 게임 점수를 넘어 파트너의 신뢰도, 협업 만족도 등 사회적 지표를 포함해야 함을 시사한다.
5. 로봇공학의 진화: 조작, 학습, 그리고 시뮬레이션 (IROS & CoRL 2022 중심)
2022년 10월을 전후하여 개최된 IROS(International Conference on Intelligent Robots and Systems)와 CoRL(Conference on Robot Learning)에서는 AI 분야의 발전이 로봇공학, 특히 조작(manipulation), 학습, 시뮬레이션 분야에 어떻게 적용되고 있는지를 보여주는 중요한 연구들이 다수 발표되었다.
5.1 고급 로봇 조작 기술
IROS 2022 최우수 논문으로 선정된 ’SpeedFolding’은 딥러닝 기반 접근법이 변형 가능한 물체(deformable object) 조작의 효율성을 획기적으로 개선할 수 있음을 보여준 대표적인 사례다.35
- 사례 연구: SpeedFolding: 이 연구의 목표는 구겨진 옷을 빠르고 안정적으로 펴고 접는 양팔 로봇 시스템을 개발하는 것이었다.37 이를 위해
BiMaMa-Net이라는 새로운 신경망 아키텍처가 제안되었는데, 이 네트워크는 RGB-D 이미지로부터 두 팔의 협응 동작(옷을 펼치는 fling, 주름을 펴는 drag 등)에 필요한 한 쌍의 그리퍼 자세를 직접 예측한다.37 4,300개의 인간 시연 및 자가 지도 학습 데이터를 통해 훈련된 로봇은 평균 120초 이내에 93%의 성공률로 옷을 접는 데 성공했다. 이는 시간당 30-40회에 해당하는 속도로, 기존 연구(시간당 3-6회) 대비 5-10배 빠른 성능이다.37
5.2 인간 중심 로봇 시뮬레이션
로봇 연구, 특히 인간과의 상호작용이 필수적인 분야에서 시뮬레이션의 중요성은 점점 더 커지고 있다. IROS 2022 RoboCup 최우수 논문으로 선정된 ’RCareWorld’는 이러한 흐름을 잘 보여준다.41
- 사례 연구: RCareWorld: 이 연구의 목표는 물리적, 사회적 돌봄 로봇 연구를 위한 인간 중심의 고충실도 시뮬레이션 환경을 구축하는 것이었다.41 RCareWorld는 임상 데이터를 기반으로 다양한 장애를 가진 현실적인 인간 모델(CareAvatars), 접근성이 다른 가정 환경(CareHomes), 그리고 다양한 돌봄 로봇을 제공한다.41 이러한 환경은 실제 로봇 실험의 높은 비용과 위험 없이 안전하고 반복 가능한 환경에서 돌봄 시나리오를 연구할 수 있게 함으로써, 돌봄 로봇 분야의 진입 장벽을 낮추고 연구를 가속화하는 데 기여한다.42
5.3 로봇 학습의 주요 동향 (CoRL 2022)
CoRL 2022에서는 로봇이 어떻게 기술을 습득하고 일반화하는지에 대한 다양한 학습 방법론이 제시되었다.5
-
모방 학습 및 일반화: 인간의 시연으로부터 로봇이 기술을 학습하는 모방 학습(Imitation Learning)이 여전히 주요 연구 주제였다. 특히, 단 한 번의 시연으로부터 특정 물체가 아닌 카테고리 수준의 조작으로 일반화하거나 44, 의미론적 기술 모방을 통해 학습한 기술을 다른 도메인으로 이전(Cross-Domain Transfer)하는 연구가 활발히 진행되었다.45
-
대규모 오프라인 데이터 활용: 웹에서 수집된 방대한 양의 오프라인 데이터를 활용하여 시각-운동 과제(visuomotor tasks)의 일반화 성능을 높이는 연구 또한 주목받았다.4
-
체화된 AI 벤치마크: 1,000개의 일상 활동을 포함하는
BEHAVIOR-1K와 같은 대규모 벤치마크의 등장은 체화된 AI 에이전트의 성능을 보다 현실적인 환경에서 평가하고 발전시키는 중요한 기반을 마련했다.4
AI 분야의 발전과 로봇공학의 발전 사이에는 ’시뮬레이션’이라는 핵심적인 매개체가 존재하며, 이 둘 사이의 선순환을 가속화하는 데 결정적인 역할을 한다. SpeedFolding은 실제 로봇을 이용한 4,300번의 상호작용으로 학습 데이터를 구축했는데, 이는 상당한 시간과 노력이 소요되는 과정이다.38 반면, AlphaTensor와 CICERO는 전적으로 시뮬레이션 환경에서 학습했다. 로봇공학, 특히 물리적 상호작용이 중요한 조작 분야에서 데이터 수집은 가장 큰 병목 중 하나이다. RCareWorld와 같은 고충실도 시뮬레이터는 변형 가능한 물체, 유체, 인간과의 상호작용 등 복잡한 물리 현상을 시뮬레이션할 수 있는 능력을 제공한다.43 이는 미래의 로봇 학습이 실제 세계에서의 데이터 수집에 대한 의존도를 줄이고, 시뮬레이션에서 생성된 대규모 합성 데이터(synthetic data)를 중심으로 전환될 것임을 시사한다. RCareWorld와 같은 시뮬레이터가 발전할수록, SpeedFolding과 같은 복잡한 조작 기술을 훨씬 더 빠르고 저렴하며 다양하게 학습시킬 수 있게 된다. 이는 결국 AI의 발전이 로봇 시뮬레이터의 발전을 촉진하고, 발전된 시뮬레이터가 다시 로봇 지능의 발전을 가속하는 강력한 피드백 루프를 형성하게 될 것임을 의미한다.
6. 산업 및 정책 동향: 기술 생태계의 확장
2022년 10월의 기술적 성과는 강력한 산업적 기반과 정책적 지원이 뒷받침되었기에 가능했다. 이 시기에는 AI 모델의 규모가 기하급수적으로 증가함에 따라 하드웨어 인프라의 혁신이 가속화되었고, 기술 생태계의 지속가능성을 위한 거버넌스 재편이 이루어졌다.
6.1 AI 하드웨어 인프라의 진화
대규모 AI 모델의 훈련 및 추론에 필요한 막대한 컴퓨팅 자원은 AI 하드웨어의 발전을 촉진하는 핵심 동력이다.
-
Meta의 Grand Teton 플랫폼: 2022년 OCP(Open Compute Project) Summit에서 발표된 Meta의 차세대 AI 하드웨어 플랫폼 ’Grand Teton’은 이러한 경향을 명확히 보여준다. 이 플랫폼은 이전 세대인 ’Zion’에 비해 호스트-GPU 간 대역폭을 4배, 컴퓨팅 및 데이터 네트워크 대역폭을 2배, 전력 공급량을 2배로 늘리는 등 대규모 AI 모델 훈련에 최적화된 성능 향상을 이루었다.9
-
액체 냉각 기술의 부상: AI 가속기의 전력 소모가 급증함에 따라 전통적인 공랭식 냉각의 한계가 명확해졌다. Meta는 공기 보조 액체 냉각(Air-Assisted Liquid Cooling, AALC)과 같은 새로운 냉각 솔루션의 필요성을 강조하며, 이는 데이터센터 설계의 근본적인 변화를 예고한다.9
6.2 오픈소스 생태계의 성숙
AI 기술의 발전은 개방적인 협력을 통해 가속화된다. PyTorch의 거버넌스 변화는 이러한 오픈소스 생태계의 성숙을 보여주는 상징적인 사건이다.
- PyTorch 재단 설립: Meta가 주도하던 PyTorch 프로젝트가 Linux 재단 산하의 독립적인 PyTorch 재단으로 이관되었다. 이는 특정 기업의 영향력에서 벗어나 보다 중립적이고 개방적인 커뮤니티 거버넌스를 통해 프로젝트의 장기적인 발전과 산업 표준화를 도모하려는 움직임으로 해석된다.9
6.3 주요국의 AI 및 로봇 정책
주요국 정부는 AI와 로봇 기술을 미래 성장 동력으로 인식하고, 기술 리더십 확보와 잠재적 위험 관리를 위한 국가적 차원의 전략을 수립했다.
-
미국: 2022년 10월, 백악관 과학기술정책실(OSTP)은 ’국가 AI R&D 전략계획’과 ‘AI의 미래 대비’ 보고서를 발표했다. 이 계획들은 AI 연구에 대한 장기 투자, 인간-AI 협력 강화, AI의 윤리적·법적·사회적 영향(ELSI) 최소화, 그리고 AI 시스템의 안전성 및 보안 기준 수립 등 포괄적인 국가 전략을 제시했다.46
-
대한민국: 산업통상자원부는 ’2022년 지능형 로봇 실행계획’을 통해 제조 및 서비스 로봇의 연구개발 및 보급 확산을 위해 전년 대비 10% 증가한 2,440억 원을 투자할 계획을 밝혔다.47 또한, 자율주행 로봇의 보도 통행 허용을 위한 지능형로봇법 개정 작업에 착수하는 등 로봇 친화적 환경 조성을 위한 규제 개선에도 적극적으로 나섰다.3
이러한 산업 및 정책 동향은 AI 연구의 ’민주화’와 ’중앙집중화’라는 두 가지 상반된 힘이 동시에 작용하고 있음을 보여준다. PyTorch 재단 설립은 누구나 접근 가능한 오픈소스 도구의 발전을 촉진하는 ’민주화’를 상징한다.9 반면, Grand Teton과 같은 거대 인프라의 등장은 최첨단 연구가 막대한 자본과 기술을 가진 소수의 기업에 의해 주도되는 ‘중앙집중화’ 경향을 심화시킨다.9 AlphaTensor나 CICERO 같은 SOTA 연구는 이러한 최첨단 인프라 없이는 사실상 불가능하지만, 그 연구 결과물(예: PyTorch 모델)은 오픈소스 생태계를 통해 전 세계 연구자들에게 공유되어 더 넓은 범위의 혁신을 촉진한다. 이는 AI 생태계가 ’기반 모델 개발(중앙집중적)’과 ’응용 모델 개발(분산적)’이라는 이중 구조로 재편되고 있음을 의미한다. 각국 정부의 정책은 이러한 구도 속에서 자국의 경쟁력을 확보하기 위해 인프라 구축 지원(중앙집중화 대응)과 개방형 생태계 활성화(민주화 촉진) 사이에서 전략적 균형을 찾아야 하는 과제에 직면하게 될 것이다.46
7. 결론: 2022년 10월 연구 동향의 종합적 분석 및 전망
2022년 10월의 AI 및 로봇공학 연구 지형을 종합적으로 분석한 결과, 이 시기는 단순한 기술적 진보를 넘어 연구 패러다임의 근본적인 전환이 이루어진 중요한 변곡점이었음이 명확해진다. 본 보고서에서 심층적으로 다룬 생성 모델의 도약, 과학적 발견의 자동화, 사회적 AI의 등장, 그리고 체화된 지능의 발전은 모두 거대 기반 모델이라는 공통된 뿌리에서 파생된 현상이다.
이러한 변화의 기저에는 몇 가지 거시적인 흐름이 존재한다.
-
규모 확장과 창발적 능력(Scaling and Emergent Abilities): 모델과 데이터의 규모가 임계점을 넘어서면서, 명시적으로 훈련되지 않은 새로운 능력이 창발적으로 나타나는 현상이 AI 발전의 핵심 동력으로 자리 잡았다. 이는 AI 연구가 더 이상 정교한 알고리즘 설계에만 의존하는 것이 아니라, 대규모 데이터와 컴퓨팅을 통해 잠재력을 끌어내는 방향으로 나아가고 있음을 보여준다.
-
AI의 도구화(AI as a Scientific Tool): AlphaTensor의 사례에서 보듯, AI는 단순히 데이터를 분석하고 패턴을 찾는 수동적인 도구를 넘어, 새로운 가설을 생성하고, 수십 년간 풀리지 않던 문제를 해결하는 알고리즘을 발견하는 등 과학적 탐구 과정에 능동적으로 참여하는 파트너로 진화하고 있다.
-
상호작용의 고도화(Sophistication of Interaction): CICERO가 증명했듯이, 인간과의 상호작용은 단순한 명령어 수행을 넘어, 사회적 맥락을 이해하고 협상과 설득을 통해 공동의 목표를 추구하는 방향으로 발전하고 있다. 이는 AI가 기술 시스템을 넘어 사회 시스템의 일원으로 통합될 가능성을 시사한다.
이러한 흐름들이 결합하여 향후 AI는 더욱 자율적이고, 범용적이며, 인간 사회에 깊숙이 통합된 형태로 발전할 것이 자명하다. Text-to-Image에서 Text-to-Video로, 그리고 궁극적으로는 물리 세계와 상호작용하는 Text-to-Action으로의 진화가 가속화될 것이다. 과학 연구의 모든 단계에서 AI가 보조자이자 협력자로서 역할을 수행하게 될 것이며, 로봇은 고도화된 지능을 바탕으로 인간의 일상과 산업 현장에 더욱 깊이 관여하게 될 것이다.
그러나 이러한 장밋빛 전망은 기술적 기회와 함께 AI 안전성, 윤리, 그리고 사회적 합의 형성이라는 중대한 과제를 동시에 제기한다. AI가 생성하는 정보의 신뢰성, 알고리즘의 편향성, 인간과의 상호작용에서 발생하는 오해와 갈등, 그리고 자동화된 의사결정에 대한 책임 소재 등은 기술 발전의 속도에 발맞춰 심도 있는 연구와 사회적 논의가 시급히 요구되는 영역이다. 2022년 10월은 AI가 열어젖힌 새로운 가능성의 시대가 시작되었음을 알리는 동시에, 인류가 이 강력한 기술을 책임감 있게 발전시켜 나가야 할 무거운 과제를 안게 되었음을 상기시키는 시점이라 할 수 있다.
8. 참고 자료
- 2022년 가장 핫한 AI 연구들 - 셀렉트스타, https://selectstar.ai/blog/insight/2022-top-ai-research/
- AI Index 2022의 주요 내용과 시사점 - 소프트웨어정책연구소, https://www.spri.kr/download/23034
- [로봇신문 선정] ’2022 국내 10대 로봇 뉴스, https://www.irobotnews.com/news/articleView.html?idxno=30424
- CoRL 2022 Accepted Paper List - Paper Copilot, https://papercopilot.com/paper-list/corl-paper-list/corl-2022-paper-list/
- CORL 2022 – Dec 14-18, 2022 – Auckland, NZ, https://corl2022.org/
- Discovering novel algorithms with AlphaTensor - Google DeepMind, https://deepmind.google/discover/blog/discovering-novel-algorithms-with-alphatensor/
- CICERO: An AI agent that negotiates, persuades, and cooperates with people - Meta AI, https://ai.meta.com/blog/cicero-ai-negotiates-persuades-and-cooperates-with-people/
- Photorealistic Text-to-Image Diffusion Models with Deep Language Understanding - NIPS, https://papers.neurips.cc/paper_files/paper/2022/file/ec795aeadae0b7d230fa35cbaf04c041-Paper-Conference.pdf
- OCP Summit 2022: Open hardware for AI infrastructure - Engineering at Meta, https://engineering.fb.com/2022/10/18/open-source/ocp-summit-2022-grand-teton/
- Video Diffusion Models, https://papers.neurips.cc/paper_files/paper/2022/file/39235c56aef13fb05a6adc95eb9d8d66-Paper-Conference.pdf
- Denoising Diffusion-based Generative Modeling: Foundations and Applications, https://cvpr2022-tutorial-diffusion-models.github.io/
- Diffusion models as plug-and-play priors - NIPS, https://proceedings.neurips.cc/paper_files/paper/2022/file/5e6cec2a9520708381fe520246018e8b-Paper-Conference.pdf
- Photorealistic Text-to-Image Diffusion Models with Deep … - NIPS, https://proceedings.neurips.cc/paper_files/paper/2022/file/ec795aeadae0b7d230fa35cbaf04c041-Paper-Conference.pdf
- NeurIPS Poster Exploring the Optimal Choice for Generative Processes in Diffusion Models: Ordinary vs Stochastic Differential Equations, https://neurips.cc/virtual/2023/poster/72998
- medium.com, https://medium.com/@jain.sm/score-based-generative-models-an-introduction-629147748500#:~:text=In%20a%20score%2Dbased%20generative,that%20resemble%20the%20training%20data.
- Score-based generative models: Score matching - Jakub M. Tomczak, https://jmtomczak.github.io/blog/16/16_score_matching.html
- Overview of Classifier-Free Guidance (CFG) - AI Tech Blog, https://www.doptsw.com/posts/post_2024-09-17_05c95f
- Classifier-Free Diffusion Guidance - OpenReview, https://openreview.net/pdf?id=qw8AKxfYbI
- Conditional Image Generation with Classifier-Free Guidance - Peter Holderrieth, http://www.peterholderrieth.com/blog/2023/Classifier-Free-Guidance-For-Diffusion-Models/
- DeepMind’s AlphaTensor Discovers New Matrix Multiplication Algorithm - Scanalyst, https://scanalyst.fourmilab.ch/t/deepminds-alphatensor-discovers-new-matrix-multiplication-algorithm/2116
- Matrix Multiplication as Tensor Decomposition - Sudeep Raja, https://sudeepraja.github.io/MatrixMultiplication/
- AlphaTensor - Johnson’s Summary, https://summary.j3soon.com/posts/alpha-tensor/
- DeepMind’s AlphaTensor Explained - AssemblyAI, https://www.assemblyai.com/blog/deepminds-alphatensor-explained
- Discovering Faster Matrix Multiplication Algorithms With Reinforcement Learning - Scribd, https://www.scribd.com/document/611590860/s41586-022-05172-4
- Discovering faster matrix multiplication algorithms with reinforcement learning - PubMed, https://pubmed.ncbi.nlm.nih.gov/36198780/
- Discovering faster matrix multiplication algorithms with reinforcement learning - PMC, https://pmc.ncbi.nlm.nih.gov/articles/PMC9534758/
- AlphaTensor for Faster Matrix Multiplication, Explained - DeepLearning.AI, https://www.deeplearning.ai/the-batch/alphatensor-for-faster-matrix-multiplication-explained/
- Diplomacy and CICERO - Meta AI, https://ai.meta.com/research/cicero/diplomacy/
- CICERO - Meta AI, https://ai.meta.com/research/cicero/
- Notes on Meta’s Diplomacy-Playing AI - LessWrong, https://www.lesswrong.com/posts/oT8fmwWddGwnZbbym/notes-on-meta-s-diplomacy-playing-ai
- Human-level play in the game of Diplomacy by combining language models with strategic reasoning - VLG, https://vlgiitr.github.io/papers_we_read/summaries/CICERO.html
- Human-level play in the game of Diplomacy by combining language models with strategic reasoning - PubMed, https://pubmed.ncbi.nlm.nih.gov/36413172/
- Research paper on how good Cicero is at persuasion and deception (not just winning games) : r/diplomacy - Reddit, https://www.reddit.com/r/diplomacy/comments/1ern30w/research_paper_on_how_good_cicero_is_at/
- More Victories, Less Cooperation: Assessing Cicero’s Diplomacy Play - arXiv, https://arxiv.org/html/2406.04643v1
- #IROS2022 best paper awards - Robohub, https://robohub.org/iros2022-best-paper-awards/
- IAR-IPR presented four papers at IEEE IROS 2022, with one of them, https://ipr.iar.kit.edu/english/3795.php
- SpeedFolding - Learning Efficient Bimanual Folding of Garments, https://pantor.github.io/speedfolding/
- SpeedFolding: Learning Efficient Bimanual Folding of Garments, https://arxiv.org/pdf/2208.10552
- pantor/speedfolding: Learning Efficient Bimanual Folding of … - GitHub, https://github.com/pantor/speedfolding
- Ken Goldberg Wins Multiple Best Paper Awards | Research UC Berkeley, https://vcresearch.berkeley.edu/news/ken-goldberg-wins-multiple-best-paper-awards
- RCareWorld: A Human-centric Simulation World for Caregiving Robots - EmPRISE Lab, https://emprise.cs.cornell.edu/rcareworld/
- RCareWorld: A Human-Centric Simulation World for Caregiving Robots - Infovaya, https://events.infovaya.com/presentation?id=84520
- RCareWorld: A Human-centric Simulation World for Caregiving Robots, https://arxiv.org/pdf/2210.10821
- Best Paper Award - Robotics: Science and Systems, https://roboticsconference.org/2022/program/awards/
- CoRL 2022 Accepted Paper List - Paper Copilot, https://staging-dapeng.papercopilot.com/paper-list/corl-paper-list/corl-2022-paper-list/
- 미국의 인공지능(AI) 정책․전략 현황과 변화 방향, https://www.nia.or.kr/common/board/Download.do?bcIdx=27248&cbIdx=82618&fileNo=1
- 「2022 지능형 로봇 실행계획」발표 - 보도자료 - 대한민국 정책브리핑, https://www.korea.kr/news/pressReleaseView.do?newsId=156498511&pageIndex=33&repCodeType=&repCode=&startDate=2008-02-29&endDate=2022-03-20&srchWord=&period=
- 「2022 지능형 로봇 실행계획」발표 - 보도자료 - 대한민국 정책브리핑, https://www.korea.kr/briefing/pressReleaseView.do?newsId=156498511
- 제4차 지능형로봇 기본계획 - KDI 경제교육, https://eiec.kdi.re.kr/policy/callDownload.do?num=247119&filenum=2&dtime=20240121104657