년 AI 및 로봇 연구 동향
1. 1991년 AI, 전환의 서막
1.1 ‘AI 겨울’ 이후의 지적 풍경
1991년은 인공지능(AI) 역사에서 중요한 전환점으로 기록된다. 1980년대 후반에 닥친 ’AI 겨울’은 전문가 시스템에 대한 과도한 상업적 기대를 냉각시켰고, 이로 인해 연구 커뮤니티는 내실을 다지며 새로운 방향을 모색하는 성찰의 시기를 맞이했다. 이 시기는 단순히 기존 연구의 연장선에 있지 않았다. 오히려, 수십 년간 AI 분야를 지배해 온 근본적인 가정들에 대한 도전과 새로운 패러다임의 태동이 동시에 일어나던 역동적인 전환점이었다.1
이러한 지적 분위기는 당시의 주요 학회 구성에서도 명확히 드러난다. 학회들은 성숙해가는 분야의 변화하는 요구에 부응하기 위해 형식과 내용을 적극적으로 실험하고 있었다. 대표적으로, 미국 인공지능 학회(AAAI-91)는 순수 과학 연구에 중점을 두면서도, 제3회 혁신적 AI 응용 학회(IAAI-91)를 같은 장소에서 동시에 개최했다.3 이 결정은 순수 이론 연구와 실제 산업 현장에서의 응용 사이의 간극을 좁히고, 이론이 현실 세계의 문제를 어떻게 해결할 수 있는지 구체적인 사례를 통해 보여주려는 의식적인 노력을 반영한다. IAAI-91에서 발표된 응용 사례들은 대부분 기업의 핵심 정보 시스템, 재무 시스템, 제조 시설과 깊숙이 통합되어 있었는데, 이는 AI 기술이 더 이상 독립적인 전문가 시스템이 아니라 비즈니스 도구 상자의 주류 계산 도구들과 동등한 위치에 올랐음을 시사하는 중요한 지표였다.3 이처럼 1991년은 AI가 실험실의 이론을 넘어 산업의 핵심으로 통합되기 시작한 해이자, 동시에 그 이론적 기반 자체에 대한 근본적인 재검토가 이루어진 해였다.
1.2 1991년 주요 학회의 역할과 주제
1991년에 개최된 주요 국제 학회들은 이러한 시대적 변화를 반영하며 각기 다른 초점과 주제를 통해 AI와 로봇공학 분야의 미래 방향을 제시했다.
- AAAI-91 (미국 인공지능 학회): 캘리포니아 애너하임에서 개최된 이 학회는 ’상호작용과 성장(interaction and growth)’을 핵심 주제로 삼았다.4 연구자 간의 소통과 학제 간 교류를 촉진하기 위해 여러 전문화된 포럼 형식의 새로운 구성을 도입했다. 또한, 심사 과정에서 잘 정립된 연구 프로그램의 결과물뿐만 아니라, 아직 초기 단계에 있는 획기적인 연구를 적극적으로 발굴하고 육성하려는 의지를 분명히 했다.4 주요 발표 주제는 통신 및 협력, 분산 AI, 물리 시스템 추론, 지각, 계획, 로보틱스, 기계 학습 등 AI의 거의 모든 분야를 망라하며 그 깊이와 폭을 과시했다.6
- IJCAI-91 (국제 인공지능 공동 학회): 호주 시드니에서 열린 이 학회는 AI의 전통적인 핵심 분야에서 더욱 깊이 있는 연구들을 선보였다.9 특히 분산 AI, 자동 추론(정리 증명, 탐색, 계획), 지식 표현, 제약 만족 문제 등 고전 AI의 형식화와 이론적 심화에 중점을 둔 논문들이 다수 발표되었다.10 주목할 만한 점은 ’퍼지 논리 및 퍼지 제어’에 대한 별도의 워크숍이 개최되었다는 사실이다.12 이는 현실 세계의 불확실성과 모호함을 다루기 위한 새로운 접근법에 대한 당시 연구 커뮤니티의 높은 관심을 반영하는 것이었다.
- NIPS 1991 (신경정보처리시스템 학회): 콜로라도 덴버에서 개최된 NIPS는 신경망 연구의 핵심 허브로서의 위상을 공고히 했다. 이 학회에서는 음성 인식, 필기체 문자 인식, 로봇 제어 등 다양한 응용 분야에서 신경망 기술의 구체적인 성공 사례들이 발표되었다.13 더 중요한 것은, 심층 신경망, 특히 순환 신경망(RNN)이 가진 근본적인 학습의 어려움(그래디언트 소실 문제)을 수학적으로 규명하고, 이를 극복하기 위한 혁신적인 아키텍처(비지도 사전훈련)가 제시된 역사적인 장이었다는 점이다.15
- ICRA-91 (IEEE 국제 로봇공학 및 자동화 학회): 캘리포니아 새크라멘토에서 열린 이 학회는 ’1990년대의 로봇공학과 제조(robotics and manufacturing in the 1990s)’를 대주제로 설정하고, 이론 개발, 실험, 제조 자동화 측면의 균형 잡힌 프로그램을 제공했다.17 로봇 매니퓰레이터 제어, 이동 로봇 경로 계획, 비전 서보잉, 학습 제어, 다중 로봇 협력 등 실제 산업 현장과 밀접하게 관련된 실용적이고 기술적인 문제 해결에 집중하는 경향을 보였다.17
아래 표는 1991년 주요 학회들의 핵심적인 특징을 요약한 것이다.
| 학회명 (Conference Name) | 개최지/기간 (Location/Date) | 핵심 주제 (Key Themes) | 주목할 만한 연구 분야 (Notable Research Areas) |
|---|---|---|---|
| AAAI-91 | 미국 애너하임 / 7월 14-19일 | 상호작용과 성장, 이론과 응용의 통합 | 분산 AI, 로봇 학습, 기계 학습, 물리 시스템 추론 |
| IJCAI-91 | 호주 시드니 / 8월 24-30일 | 분산 AI, 자동 추론, 지식 표현의 형식화 | 다중 에이전트 통신 이론, 제약 만족 문제, 비단조 추론, 퍼지 논리 |
| NIPS 1991 | 미국 덴버 / 12월 2-5일 | 신경망의 이론적 기반 및 응용 확장 | 순환 신경망의 학습 문제, 비지도 사전훈련, 음성/문자 인식 |
| ICRA-91 | 미국 새크라멘토 / 4월 9-11일 | 1990년대의 로봇공학과 제조 | 매니퓰레이터 제어, 이동 로봇 경로 계획, 비전 서보잉, 다중 로봇 협력 |
1.3 보고서의 구조
본 보고서는 1991년을 기점으로 나타난 주요 지적 흐름을 따라 AI와 로봇공학 분야의 핵심적 발전을 주제별로 심층 분석한다. 먼저, 로드니 브룩스가 촉발한 ’표상 없는 지능’이라는 행동주의 혁명을 살펴보고, 이것이 전통적인 AI 패러다임에 어떤 도전을 제기했는지 분석한다. 다음으로, 심층 학습의 이론적 토대를 마련한 신경망 연구의 근본적인 돌파구들을 탐구한다. 이어서, 분산 AI와 자동 추론 등 고전 AI 분야가 어떻게 심화되고 확장되었는지 검토한다. 마지막으로, 로봇공학 분야의 구체적인 기술적 진보를 조명하고, 이 모든 1991년의 유산이 어떻게 현대 AI 기술의 초석이 되었는지 종합적으로 논하며 결론을 맺는다.
2. 표상 없는 지능: 행동주의 로봇공학의 혁명
1991년은 AI의 근본 패러다임에 대한 가장 강력한 도전 중 하나가 제기된 해로 기억된다. MIT의 로드니 브룩스는 기존의 상징주의 AI가 추구해 온 길과는 전혀 다른 방향을 제시하며, ’행동주의 로봇공학(Behavior-Based Robotics)’이라는 새로운 흐름을 주도했다.
2.1 로드니 브룩스의 선언: “Intelligence without Representation”
1991년, 저명한 저널 Artificial Intelligence에 발표된 로드니 브룩스의 논문 “Intelligence without Representation“은 하나의 선언문과 같았다.2 이 논문은 당시 AI 연구의 핵심 과제로 여겨졌던 ’표상(representation)’의 문제를 정면으로 공격했다.
브룩스의 핵심 주장은 지능이 세계에 대한 명시적이고 상징적인 내부 모델을 구축하고, 그 모델 위에서 논리적 추론을 수행하는 과정을 통해 발생하는 것이 아니라는 것이다. 대신, 그는 지능이란 복잡한 환경과 직접적으로 상호작용하는 과정에서 ’창발(emerge)’하는 속성이라고 보았다.2 즉, 지능은 분리된 뇌 안의 추상적 과정이 아니라, 신체를 가진 행위자가 환경 속에서 수행하는 지각-행동의 긴밀한 결합(perception-action coupling) 그 자체라는 것이다. 그는 이러한 철학을 “세계는 그 자체로 최고의 모델이다(the world is its own best model)“라는 간결한 문장으로 요약하며, 복잡하고 불완전할 수밖에 없는 내부 표상을 구축하고 유지하는 데 계산 자원을 낭비할 필요가 없다고 역설했다.2
그는 더 나아가, 체스 게임, 블록 쌓기 등 잘 정의된 ’장난감 세계(toy worlds)’에 국한된 기존 AI 연구가 지능의 본질을 오도해왔다고 강하게 비판했다. 이러한 연구들은 지각(perception)과 행동(motor skills)이라는 ’진짜 어려운 문제’를 ’추상화’라는 이름 아래 의도적으로 배제함으로써, 문제의 본질을 회피하고 있다고 지적했다.2
2.2 감각-계획-행동(Sense-Plan-Act) 모델의 해체
브룩스의 비판은 전통적인 로봇 제어 패러다임이었던 ‘감각-계획-행동(Sense-Plan-Act, SPA)’ 모델을 직접적으로 겨냥했다. SPA 모델은 다음과 같은 순차적이고 중앙집중적인 처리 방식을 따른다.21
- 감각(Sense): 센서를 통해 외부 세계에 대한 정보를 수집한다.
- 계획(Plan): 수집된 정보를 바탕으로 완전한 내부 세계 모델(world model)을 갱신하고, 이 모델을 기반으로 목표를 달성하기 위한 일련의 행동 계획을 수립한다.
- 행동(Act): 수립된 계획에 따라 액추에이터를 움직여 행동을 수행한다.
브룩스는 이 모델이 끊임없이 변화하는 동적인 실제 환경에서는 너무 느리고 취약(brittle)하다고 주장했다. 세계 모델을 항상 최신 상태로 정확하게 유지하는 것은 거의 불가능하며, 설령 가능하다 하더라도 계획을 수립하는 과정의 계산적 복잡성 때문에 실시간 대응이 어렵다는 것이다.23
이에 대한 대안으로 행동주의 로봇공학은 SPA 모델의 수평적 분해(기능별 모듈화: 지각 모듈, 계획 모듈, 행동 모듈) 대신, 행동을 기준으로 하는 수직적 분해를 제안했다. 즉, ‘장애물 회피’, ’벽 따라가기’와 같은 각각의 행동 단위가 센서 입력부터 액추에이터 출력까지 직접 연결되는, 분산적이고 반응적인 구조를 지향했다. 이는 지능을 중앙 계획자가 통제하는 것이 아니라, 다수의 단순한 행동들이 환경과의 상호작용 속에서 경쟁하고 협력하며 발현되는 것으로 보는 관점의 전환이었다.2
2.3 서브섬프션 아키텍처
브룩스가 자신의 행동주의 철학을 구현하기 위해 제안한 구체적인 제어 구조가 바로 ’서브섬프션 아키텍처(The Subsumption Architecture)’다.23 이 아키텍처는 여러 행동 계층(layers of behavior)으로 구성되며, 각 계층은 특정 수준의 역량(level of competence)을 독립적으로 수행한다.
계층들은 단순한 행동에서 복잡한 행동으로 위계를 이룬다. 예를 들어, 가장 낮은 계층은 ’장애물 회피’와 같은 기본적인 생존 및 반응 행동을 담당한다. 그 위 계층은 ’돌아다니기(wander)’와 같은 탐색 행동을, 그리고 더 높은 계층은 ’특정 장소로 이동하기’와 같은 목적 지향적인 행동을 구현할 수 있다.26
이 아키텍처의 핵심은 ‘서브섬(subsume)’ 메커니즘에 있다. 모든 계층은 병렬적으로 작동하며 센서 정보를 받지만, 상위 계층은 필요에 따라 하위 계층의 출력을 억제(inhibit)하거나 자신의 출력으로 대체(suppress)함으로써 로봇의 최종 행동 제어권을 ’포섭(subsume)’한다.25 예를 들어, ‘돌아다니기’ 계층이 로봇에게 전진 명령을 내리고 있더라도, ‘장애물 회피’ 계층이 전방의 벽을 감지하면 이 전진 명령 신호를 억제하고 즉시 회피 기동을 수행하는 식이다. 이 과정에는 중앙 조정자나 복잡한 계획 수립 과정이 전혀 개입되지 않는다. 오직 계층 간의 간단한 신호 억제와 대체를 통해 분산적으로 행동 선택과 중재가 실시간으로 이루어진다.
이러한 구조는 개발 방법론에도 영향을 미쳤다. 개발자는 가장 낮은 계층의 기본적인 행동부터 점진적으로 구축하고 실제 환경에서 충분히 테스트한 뒤, 그 위에 새로운 상위 계층을 추가하는 방식으로 복잡한 시스템을 견고하게 개발할 수 있었다.27
2.4 행동주의 로봇공학의 영향과 유산
브룩스의 연구는 로봇공학계에 지대한 영향을 미쳤다. 그의 접근법은 값비싼 중앙 컴퓨터 없이도 저렴한 마이크로컨트롤러만으로 자율 로봇을 구현할 수 있는 길을 열어주었고, 이는 로봇 연구의 대중화와 실용적인 로봇 개발을 촉진하는 계기가 되었다.22
이러한 영향은 학계를 넘어 상업적 성공으로까지 이어졌다. 브룩스가 공동 창업한 회사 iRobot이 2002년에 출시한 로봇 청소기 ’룸바(Roomba)’는 행동주의 로봇공학 철학의 성공적인 상업화 사례로 꼽힌다. 초기 룸바는 정교한 지도를 작성하거나 최적의 경로를 계획하는 대신, ‘벽 따라가기’, ‘나선형으로 돌기’, ‘장애물 만나면 방향 바꾸기’ 등 몇 가지 단순한 반응적 행동 규칙들의 조합만으로 ’방을 청소한다’는 복잡하고 유용한 작업을 효과적으로 수행했다.30 이는 값비싼 센서나 강력한 프로세서 없이도 실용적인 로봇을 만들 수 있음을 증명한 것이다.
철학적으로는 ’체화된 인지(Embodied Cognition)’와 ’상황화된 지능(Situated Intelligence)’이라는 개념을 AI 분야에 본격적으로 확산시키는 계기가 되었다.21 지능은 신체(embodiment)와 환경(situatedness)과의 역동적인 상호작용 속에서만 온전히 이해될 수 있다는 그의 관점은, 이후 인지과학과 철학, 그리고 AI 연구 전반에 깊은 영감을 주었다.
아래 표는 브룩스가 도전했던 전통적 상징주의 AI와 그가 제안한 행동주의 AI의 핵심적인 차이점을 명확히 비교하여 보여준다.
| 구분 (Category) | 전통적 상징주의 AI (Traditional Symbolic AI) | 행동주의 AI (Behavior-Based AI) |
|---|---|---|
| 핵심 철학 | 지능은 표상에 대한 추론이다 (Intelligence as reasoning over representation) | 지능은 환경과의 상호작용에서 창발한다 (Intelligence as emergent behavior from interaction) |
| 세계 모델 | 명시적, 중앙집중적, 기호적 세계 표상 구축 | 표상 최소화, “세계는 그 자체로 최고의 모델” |
| 제어 흐름 | 순차적 (감각 → 계획 → 행동) | 병렬적, 반응적 (다수의 감각-행동 루프) |
| 분해 방식 | 기능적 분해 (지각, 모델링, 계획, 실행) | 행동적 분해 (장애물 회피, 탐색, 목표 추구) |
| 지능의 원천 | 중앙 계획자 (Central Planner) | 분산된 행동들의 상호작용 |
| 대표 아키텍처 | Sense-Plan-Act (SPA) | 서브섬프션 아키텍처 (Subsumption Architecture) |
3. 심층 학습의 여명: 신경망 연구의 근본적 돌파구
1991년은 현대 심층 학습(Deep Learning)의 이론적 토대가 마련된 결정적인 해였다. 당시 신경망 연구는 부흥기를 맞고 있었으나, 여러 층으로 구성된 깊은 네트워크를 효과적으로 훈련시키는 데에는 근본적인 한계가 있었다. 1991년에 이르러 이 문제의 원인이 명확히 규명되고, 이를 해결하기 위한 혁신적인 아이디어들이 제시되었다.
3.1 근본적 딥러닝 문제의 형식화: 소실/폭주하는 그래디언트
1991년, 독일 뮌헨 공과대학교의 제프 호흐라이터(Sepp Hochreiter)는 그의 지도교수 위르겐 슈미트후버(Jürgen Schmidhuber)의 지도 아래 작성한 디플로마 논문에서 심층 신경망, 특히 순환 신경망(RNN)의 학습이 왜 그토록 어려운지에 대한 근본적인 이유를 수학적으로 분석하고 명확하게 공식화했다.16
그의 분석의 핵심은 역전파(backpropagation) 알고리즘의 본질에 있었다. 심층 신경망에서 출력층의 오차는 손실 함수의 그래디언트(gradient) 형태로 입력층 방향으로 역전파된다. RNN의 경우, 시간이 펼쳐진(unfolded) 네트워크를 따라 과거 시점으로 오차가 전파된다. 이 과정에서 그래디언트는 각 층(또는 각 시점)을 거칠 때마다 활성화 함수의 도함수와 가중치 행렬의 곱셈을 반복적으로 거치게 된다. 호흐라이터는 이 반복적인 곱셈 과정에서 문제가 발생함을 보였다.34 만약 활성화 함수 도함수의 절댓값이 지속적으로 1보다 작으면, 그래디언트는 여러 층을 거치면서 지수적으로 감소하여 결국 0에 가깝게 사라져 버린다. 이를 ’소실 그래디언트 문제(vanishing gradient problem)’라 한다. 반대로, 이 값이 1보다 크면 그래디언트는 지수적으로 증폭되어 계산이 불안정해지는 ’폭주 그래디언트 문제(exploding gradient problem)’가 발생한다.
이 분석의 결과는 심각했다. 그래디언트가 소실되면, 네트워크의 초기 층(RNN에서는 먼 과거의 시점)에 위치한 가중치들은 거의 업데이트되지 않는다. 이는 네트워크가 데이터의 장기 의존성(long-term dependencies), 예를 들어 문장의 시작 부분에 있는 단어가 문장 끝의 의미에 미치는 영향 등을 학습하는 것이 사실상 불가능함을 의미했다. 이 문제는 1991년 이전의 심층 신경망 및 순환 신경망이 실용적인 성공을 거두지 못한 핵심적인 이론적 원인이었다.16
3.2 비지도 사전훈련: 심층 학습의 첫 번째 해결책
같은 해, 위르겐 슈미트후버는 이 근본적인 심층 학습 문제를 해결하기 위한 구체적인 방법론을 제시했다. 바로 ’비지도 사전훈련(unsupervised pre-training)’이라는 혁신적인 아이디어였다.15
그가 제안한 ‘신경망 시퀀스 청커(Neural Sequence Chunker)’ 또는 ‘신경망 역사 압축기(Neural History Compressor)’ 아키텍처는 여러 개의 RNN을 계층적으로 쌓은 구조였다.15 이 시스템의 작동 원리는 다음과 같다.
- 계층적 예측: 각 RNN 계층은 자신의 바로 아래 계층으로부터 들어오는 데이터 스트림을 보고, 다음 입력을 예측하는 ’예비 과제(pretext task)’를 비지도 방식(self-supervised)으로 학습한다.
- 예측 코딩(Predictive Coding): 이 아키텍처의 핵심은 정보의 필터링에 있다. 만약 하위 계층의 RNN이 다음 입력을 성공적으로 예측했다면, 그 정보는 이미 학습되었고 압축 가능한 것으로 간주되어 상위 계층으로 전달되지 않는다. 오직 예측에 실패한 ‘놀라운(surprising)’ 정보, 즉 새로운 정보만이 상위 계층 RNN의 입력으로 전달된다.15
- 다중 시간 척도 학습: 이 메커니즘으로 인해, 상위 계층으로 갈수록 RNN은 더 드물게 활성화되며, 이는 더 긴 시간 척도(timescale)에서 더 추상적이고 중요한 정보를 처리하게 됨을 의미한다.
- 학습 촉진: 이 계층적 압축 과정은 전체 시퀀스의 유효 깊이를 효과적으로 줄여준다. 따라서 이후에 지도 학습(supervised learning)을 통해 전체 네트워크를 미세 조정(fine-tuning)할 때, 그래디언트 소실 문제가 크게 완화되어 학습이 훨씬 용이해진다. 슈미트후버의 연구팀은 1993년까지 이 방법을 사용하여 1000개 이상의 순차적인 계산 단계를 요구하는 매우 깊은 학습 문제를 해결할 수 있음을 보였다.15
이 아이디어는 현대 AI에 지대한 영향을 미쳤다. 라벨이 없는 대량의 데이터로 모델의 일반적인 특징을 먼저 학습시킨 후, 특정 과제에 맞게 미세 조정하는 현대의 ‘사전훈련-미세조정(Pre-train, Fine-tune)’ 패러다임, 특히 GPT(Generative Pre-trained Transformer)와 같은 대규모 언어 모델의 핵심 철학은 슈미트후버의 1991년 연구에 직접적인 뿌리를 두고 있다.15
3.3 NIPS 1991: 신경망 응용의 확장
이러한 근본적인 이론적 탐구와 더불어, NIPS 1991 학회에서는 신경망의 구체적인 응용 연구가 활발하게 발표되며 그 가능성을 확장했다.13
- 음성 및 문자 인식: 전화 음성을 이용한 영어 알파벳 인식, 여러 글자가 겹쳐 있는 필기체 문자 인식 등 실용적인 패턴 인식 문제에 신경망이 성공적으로 적용되었다. 특히, 신경망과 기존의 강력한 통계 모델인 은닉 마르코프 모델(Hidden Markov Model, HMM)을 결합하는 하이브리드 접근법이 다수 제안되어 당시 최첨단 기술을 이루었다.13
- 제어 및 로보틱스: 신경망을 이용해 기존의 PID 제어기를 개선하거나, 로봇 팔의 운동 명령을 생성하는 연구들이 발표되었다. 특히, ’A Cortico-Cerebellar Model that Learns to Generate Distributed Motor Commands to Control a Kinematic Arm’과 같은 연구는 인간의 소뇌-대뇌피질 모델에서 영감을 받아, 생물학적 제어 시스템의 원리를 로봇 제어에 적용하려는 시도를 보여주었다.13
- 학습 이론 및 알고리즘: 블라디미르 베이프닉(Vladimir Vapnik) 등이 발표한 ’문자 인식을 위한 구조적 위험 최소화(Structural Risk Minimization for Character Recognition)’는 이후 서포트 벡터 머신(SVM)의 이론적 기반이 된 중요한 연구였다. 또한, 가중치 감쇠(Weight Decay)를 통한 일반화 성능 향상, 순환 역전파(Recurrent Back-Propagation)를 이용한 학습 등 다양한 학습 알고리즘과 그 이론적 기반에 대한 심도 있는 논의가 이루어졌다.13
결론적으로, 1991년은 심층 학습의 근본적인 난제가 명확히 정의되고, 그 첫 번째 해결책이 제시된 해였다. 이는 단순히 하나의 문제를 해결한 것을 넘어, 이후 LSTM과 트랜스포머로 이어지는 현대 심층 학습의 거대한 흐름을 시작시킨 역사적인 순간이었다.
4. 지능의 확장과 분산: 다중 에이전트 시스템과 자동 추론
1991년은 심층 학습과 행동주의라는 새로운 패러다임이 부상하는 동시에, AI의 전통적인 핵심 분야인 기호주의적 접근법 역시 이론적으로 더욱 정교해지고 그 적용 범위를 확장해 나간 시기였다. 특히 IJCAI-91 학회는 이러한 고전 AI의 성숙을 보여주는 중요한 무대였다.
4.1 분산 인공지능(DAI)의 성숙
단일한 중앙집중적 지능을 넘어, 다수의 자율적인 지능체, 즉 에이전트(agent)들 간의 상호작용을 통해 복잡한 문제를 해결하려는 분산 인공지능(Distributed AI, DAI) 및 다중 에이전트 시스템(Multi-Agent Systems, MAS) 연구가 1991년에 중요한 이정표를 세웠다.11
이 시기의 연구는 더 이상 추상적인 개념에 머무르지 않고, 에이전트 간의 상호작용을 수학적으로 엄밀하게 정의하고 분석하려는 방향으로 나아갔다.
- 에이전트 통신 이론: Munindar P. Singh의 논문 ’다중 에이전트 시스템을 위한 통신의 형식 이론을 향하여(Towards a Formal Theory of Communication for Multi-agent Systems)’는 이러한 흐름을 대표하는 연구였다. 이 논문은 에이전트들이 서로의 의도를 이해하고 신뢰성 있는 정보를 교환하기 위한 통신 행위의 의미론을 형식 논리로 정의하고자 시도했다.10
- 협상 및 조정 메커니즘: ’다중 에이전트 환경에서의 시간에 걸친 협상(Negotiations Over Time in a Multi-Agent Environment)’이나 ’다중 에이전트 상호작용 조정을 위한 결정 이론적 접근(A Decision-Theoretic Approach to Coordinating Multi-agent Interactions)’과 같은 연구들은 각자의 목표를 가진 에이전트들이 어떻게 갈등을 해결하고, 자원을 분배하며, 공동의 목표를 달성하기 위해 협력하는지에 대한 구체적인 알고리즘과 전략을 탐구했다.11
이러한 1991년의 연구들은 개별 지능의 능력을 넘어 ’사회적 지능’의 가능성을 탐구했다는 점에서 큰 의의를 가진다. 이는 수십 년 후, 다수의 대규모 언어 모델(LLM) 에이전트들이 서로 협력하여 복잡한 작업을 자율적으로 수행하는 현대의 AI 에이전트 시스템의 이론적 기반을 제공했다.40
4.2 탐색과 추론의 효율화
최적의 해를 찾는 탐색(search)과 논리적 결론을 도출하는 추론(reasoning)은 AI의 오랜 핵심 과제였다. 1991년에는 이러한 고전적인 문제들을 더 효율적으로 풀기 위한 새로운 아이디어들이 제시되었다.
-
학습을 통한 허용 추정치 발견: IJCAI-91에서 발표된 Anna Bramanti-Gregor와 Henry W. Davis의 논문 ’문제 해결 중 허용 추정치 학습(Learning Admissible Heuristics while Solving Problems)’은 탐색 알고리즘의 성능을 동적으로 개선하는 방법을 제시한 중요한 연구였다.11
-
기존의 문제: A*와 같은 최적 탐색 알고리즘은 최적 해를 보장하기 위해 목표까지의 실제 비용을 과대평가하지 않는 ‘허용 가능한(admissible)’ 휴리스틱 함수를 필요로 한다. 하지만 종종 비허용(non-admissible) 휴리스틱이 탐색 방향을 더 효과적으로 안내할 수 있다. 이 경우, 빠른 탐색과 해의 최적성 보장이라는 두 가지 목표가 상충하게 된다.41
-
제안된 방법: 이 논문은 이러한 딜레마를 해결하기 위해, 처음에는 비허용 휴리스틱을 사용하여 일련의 문제들을 빠르게 풀어나가면서 그 과정에서 얻는 정보(실제 경로 비용 등)를 바탕으로 휴리스틱 함수를 동적으로 수정하는 방법을 제안했다. 이 학습 과정을 통해 휴리스틱은 점차 허용 가능한 형태로 수렴하게 된다. 결과적으로, 시스템은 초기에는 빠른 탐색으로 높은 품질의 해를 찾고, 경험이 쌓임에 따라 점차 최적 해를 보장하는 방향으로 진화할 수 있게 된다.41 이는 정적인 지식을 사용하는 대신, 경험을 통해 추론 능력을 스스로 개선해 나가는 ’학습 기반 추론’의 초기 형태로 볼 수 있다.
-
NP-완전 문제의 상전이 현상: 또 다른 흥미로운 연구는 계산 복잡도 이론에서 나왔다. IJCAI-91에서는 3-SAT과 같은 NP-완전 문제들이 특정 ‘순서 매개변수(order parameter)’(예: 변수 대비 절의 비율)의 임계값에서 갑자기 어려워지는 ‘상전이(phase transition)’ 현상을 보인다는 경험적 연구 결과가 발표되었다.44 이 임계값은 문제의 제약이 부족하여 해를 찾기 쉬운 영역과, 제약이 과도하여 해가 존재하지 않을 가능성이 높은 영역을 구분하는 경계선 역할을 한다. 가장 해결하기 어려운 ’정말 어려운 문제들’은 바로 이 상전이가 일어나는 좁은 경계 영역에 집중되어 있음이 밝혀졌다. 이는 문제의 평균적인 난이도뿐만 아니라, 난이도의 분포에 대한 새로운 이론적 통찰을 제공하며, 이후 알고리즘 개발 및 평가에 중요한 영향을 미쳤다.
4.3 불확실성 처리: 퍼지 논리의 부상
현실 세계의 정보는 명확하게 참(true) 또는 거짓(false)으로 나뉘기보다는 모호하고 불확실한 경우가 많다. 이러한 정보를 다루기 위한 대안적 접근법으로 퍼지 논리(Fuzzy Logic)가 1991년에 큰 주목을 받았다. IJCAI-91에서는 퍼지 논리 및 퍼지 제어에 대한 워크숍이 별도로 개최될 만큼 그 관심이 뜨거웠다.12
이 워크숍에서는 퍼지 집합 이론, 가능성 이론(possibilistic logic)과 같은 퍼지 논리의 이론적 기반에 대한 연구와 더불어, 이를 신경망과 결합한 퍼지 신경망, 그리고 실제 응용 분야에 대한 연구가 폭넓게 다루어졌다. 특히 John Yen 등이 발표한 ’이동 로봇 경로 제어기에서의 퍼지 논리 사용(Using Fuzzy Logic in a Mobile Robot Path Controller)’과 같은 연구는 “장애물에 가깝다”, “속도를 약간 줄인다“와 같이 인간의 직관적인 언어로 표현되는 규칙을 사용하여 로봇을 제어하는 퍼지 제어의 실용성을 보여주었다.12 이는 정밀한 수학적 모델링이 어려운 복잡한 시스템을 효과적으로 제어하는 새로운 길을 제시했다.
5. 현실 세계로의 전진: 로봇공학의 주요 기술 발전
1991년 로봇공학 분야는 실험실 환경을 넘어 공장 자동화, 비정형 환경 탐사 등 현실 세계의 복잡한 문제들을 해결하기 위한 구체적이고 실질적인 기술 발전에 집중했다. 특히 IEEE 국제 로봇공학 및 자동화 학회(ICRA-91)는 이러한 기술적 진보를 한눈에 볼 수 있는 장이었다.17
5.1 매니퓰레이터 제어의 정교화
로봇 팔, 즉 매니퓰레이터를 더 정밀하고 유연하며 강인하게 제어하기 위한 다양한 연구가 발표되었다.20
- 적응 및 강인 제어: 로봇의 동역학 모델은 완벽할 수 없으며, 작업 중 예상치 못한 외력이 가해질 수 있다. ’로봇 팔을 위한 새로운 적응 제어기의 비교 실험(Comparative experiments with a new adaptive controller for robot arms)’과 같은 연구들은 이러한 모델의 불확실성이나 외부 환경 변화에도 로봇이 안정적으로 원하는 작업을 수행할 수 있도록 하는 적응 제어 및 강인 제어(robust control) 알고리즘 개발에 중점을 두었다.20
- 힘 제어 및 다중 로봇 협력: 로봇이 단순히 위치를 이동하는 것을 넘어, 환경과 정밀한 물리적 상호작용을 수행하는 힘 제어(force control) 기술이 중요한 연구 주제였다. 더 나아가, ’두 대의 협력 로봇을 위한 위치 및 힘 제어(Position and force controls for two coordinating robots)’나 ’다중 로봇 시스템을 이용한 조작 시 접촉 조건 제어(Control of contact conditions for manipulation with multiple robotic systems)’와 같은 연구들은 여러 대의 로봇이 힘을 조율하며 하나의 무거운 물체를 함께 들거나 정교한 조립 작업을 수행하는 협력 제어 기술을 다루었다.20
- 유연 로봇 제어: 기존의 로봇은 모든 부품이 완벽하게 단단한 강체(rigid body)라고 가정했지만, 고속으로 움직이거나 가벼운 소재를 사용할 경우 링크나 관절의 유연성(flexibility)이 성능에 큰 영향을 미친다. ’유연 관절 및 링크를 가진 매니퓰레이터의 상태 피드백 H∞ 제어(State feedback H∞ control of manipulators with flexible joints and links)’와 같은 연구는 이러한 기계적 유연성을 모델에 포함하고, 그로 인한 진동을 억제하는 고성능 제어 이론을 탐구했다.20
5.2 이동 로봇: 자율성과 경로 계획
공장과 같은 잘 정돈된 환경을 넘어, 구조화되지 않은(unstructured) 실외나 재난 현장 등에서 로봇을 운용하려는 요구가 증가하면서 이동 로봇의 자율성과 경로 계획 기술이 빠르게 발전했다.45
- 이동 매니퓰레이터(Mobile Manipulator): 이동 플랫폼 위에 로봇 팔이 장착된 이동 매니퓰레이터는 작업 영역의 한계를 극복할 수 있어 큰 주목을 받았다. 하지만 이동 능력(mobility)이 추가되면서 시스템의 자유도가 증가하여 경로 계획 문제가 훨씬 복잡해졌다. 1991년의 연구들은 이로 인해 발생하는 여유 자유도(redundancy)를 단순히 제어의 대상으로만 보지 않고, 여러 작업 지점을 순회할 때 최적의 로봇 베이스 위치와 팔 자세를 동시에 결정하는 전역 최적화 문제로 접근했다. 이를 해결하기 위해 시뮬레이티드 어닐링(simulated annealing)과 같은 전역 최적화 기법이 적용되었다.46
- 동적 환경에서의 경로 계획: ’동적이고 불확실한 환경에서 로봇을 위한 안전한 동작 계획(Safe motion planning for a robot in a dynamic, uncertain environment)’과 같은 연구들은 정적인 장애물 지도를 가정하는 대신, 움직이는 장애물이나 예측 불가능한 변화에 실시간으로 대응하며 안전한 경로를 재계획하는 알고리즘을 모색했다.20
- 센서 기반 항법: 로봇이 자신의 위치를 정확히 알고 있다는 가정에서 벗어나, 센서 데이터를 직접 활용하여 주변 환경을 인식하고 자신의 위치를 추정하며 주행하는 기술이 핵심 과제로 부상했다. ’항법 제어를 위한 센서 추상화(Sensor abstractions for control of navigation)’나 ’실시간 비전 기반 로봇 위치 측정(Real-time vision-based robot localization)’과 같은 연구들은 카메라 이미지나 다른 센서 정보로부터 로봇의 항법에 필요한 핵심 정보를 추출하고, 이를 제어에 직접 활용하는 방법을 탐구했다.20
5.3 로봇 학습의 초기 단계
로봇의 모든 행동을 인간이 수동으로 프로그래밍하는 것의 한계를 인식하고, 로봇이 스스로 경험을 통해 행동을 개선하는 능력을 부여하려는 연구가 1991년에 중요한 진전을 이루었다.
- 강화 학습과 경험 재현: AAAI-91에서 Long-Ji Lin이 발표한 논문은 로봇 학습 분야의 기념비적인 연구 중 하나다.47 그는 시행착오를 통해 학습하는 강화 학습(reinforcement learning)의 가장 큰 문제점인 느린 학습 속도를 개선하기 위해 ‘경험 재현(experience replay)’ 기법을 제안했다. 이는 로봇이 과거에 겪었던 경험(특정 상태에서 특정 행동을 했을 때 어떤 보상을 받았는지)을 메모리에 저장해 두었다가, 나중에 반복적으로 재사용하여 학습 효율을 극적으로 높이는 방법이다. 이 아이디어는 20여 년 후, 딥마인드(DeepMind)가 심층 신경망과 Q-러닝을 결합하여 개발한 DQN(Deep Q-Network)의 핵심 구성 요소가 되어 심층 강화 학습 혁명의 기폭제가 되었다.
- 시뮬레이션-현실 전이(Sim-to-Real Transfer): Lin의 연구는 또 다른 중요한 가능성을 보여주었다. 그는 시뮬레이션 환경에서 로봇이 장애물을 피해 목표 지점까지 이동하고 스스로 배터리를 재충전하는 복잡한 행동들을 성공적으로 학습시킨 후, 학습된 정책을 거의 수정 없이 실제 로봇에 이식하여 실제 세계에서도 성공적으로 작동함을 보였다.47 이는 위험하고 시간이 많이 소요되는 실제 로봇 학습을 안전하고 빠른 시뮬레이션으로 대체할 수 있는, 즉 ’시뮬레이션-현실 전이’의 초기 성공 사례로 평가받는다.
- 불확실한 환경에서의 학습: B. John Oommen 등의 연구는 센서 정보에 잡음(noise)이 있는 불확실한 작업 공간에서 학습 오토마타(learning automaton)라는 이론적 모델을 사용하여 로봇이 목표 지점으로 이동하는 방법을 점진적으로 학습하는 방법을 제시했다.48 이는 로봇이 환경의 불확실성을 학습을 통해 내재적으로 극복하려는 시도였다.
이처럼 1991년의 로봇공학 연구는 제어, 계획, 학습이라는 세 가지 축을 중심으로, 로봇을 더욱 지능적이고 자율적이며 현실 세계에 유용한 존재로 만들기 위한 핵심 기술들을 발전시켜 나갔다.
6. 결론: 1991년의 유산과 현대 AI에의 시사점
6.1 1991년: 현대 AI의 씨앗이 뿌려진 해
1991년은 인공지능 역사에서 단순한 한 해가 아니라, 미래를 결정지은 중요한 변곡점이었다. 이 시기는 두 가지 상반된 흐름이 공존하며 지적인 긴장과 창조적 에너지를 폭발시킨 해였다. 한편에서는 논리, 탐색, 지식 표현으로 대표되는 고전적 AI가 형식화와 효율화를 통해 그 이론적 깊이를 더하며 성숙해갔다. 다른 한편에서는, 수십 년간 이어져 온 상징주의 패러다임의 근본적인 한계에 도전하는 혁명적인 아이디어들—표상 없는 지능을 주장한 행동주의와, 뇌의 작동 방식에서 영감을 받은 연결주의—이 구체적인 이론과 검증 가능한 아키텍처로 제시되었다.
1991년에 제시된 개념들은 단순한 아이디어를 넘어, 이후 30년간 AI 기술의 발전을 이끌어온 핵심적인 연구 흐름들의 직접적인 기원이 되었다. 이 해에 뿌려진 씨앗들은 오랜 기간의 연구와 컴퓨팅 성능의 발전을 자양분으로 삼아, 오늘날 우리가 경험하고 있는 AI 혁명의 거대한 나무로 성장했다.
6.2 1991년 연구와 현대 기술의 연결
1991년의 연구 성과들과 현대 AI 기술 사이에는 명확하고 직접적인 계보가 존재한다.
- 심층 학습의 계보: 제프 호흐라이터의 그래디언트 소실 문제에 대한 수학적 분석은, 이 문제를 해결하기 위해 설계된 Long Short-Term Memory (LSTM) 네트워크가 1997년에 탄생하는 직접적인 계기가 되었다.34 위르겐 슈미트후버가 제안한 비지도 사전훈련과 신경망 압축(이는 현대적 용어로 ’지식 증류’의 원형이다) 개념은, 대규모 언어 모델(LLM)의 표준 개발 방식이 된 ‘사전훈련-미세조정’ 패러다임과 거대 모델을 경량화하는 지식 증류 기술의 명백한 원형이다.15
- 자율 로봇의 진화: 로드니 브룩스의 행동주의 로봇공학 철학과 서브섬프션 아키텍처는 iRobot의 룸바와 같은 상업적으로 가장 성공한 로봇의 탄생을 이끌었을 뿐만 아니라, 복잡한 세계 모델이나 계획 없이도 환경과 실시간으로 상호작용하는 자율 드론, 탐사 로버, 그리고 다양한 서비스 로봇 개발에 지속적인 영향을 미치고 있다.22
- AI 에이전트의 기원: IJCAI-91에서 활발히 논의되었던 분산 AI와 다중 에이전트 간의 통신, 협상, 조정에 대한 형식 이론들은, 오늘날 여러 LLM 기반 AI 에이전트들이 서로 협력하여 복잡한 작업을 자율적으로 계획하고 수행하는 시스템의 중요한 이론적 토대를 제공했다.11
- 심층 강화 학습의 초석: Long-Ji Lin이 제안한 ‘경험 재현(experience replay)’ 기법은 1991년 당시에는 강화 학습의 효율을 높이는 하나의 기법이었지만, 2013년 딥마인드의 DQN에서 심층 신경망과 결합되면서 심층 강화 학습이라는 새로운 분야를 여는 핵심적인 열쇠 역할을 했다.47
6.3 1991년이 주는 교훈
1991년의 역사는 AI의 발전에 대해 몇 가지 중요한 교훈을 남긴다.
첫째, AI의 발전은 단일한 패러다임을 따라 선형적으로 이루어지지 않는다. 1991년은 상징주의, 연결주의, 행동주의라는 서로 다른, 때로는 적대적으로 보이는 접근법들이 치열하게 경쟁하고 서로를 비판하며 공존했던 시기였다. 이러한 지적 다양성과 경쟁이 오히려 전체 분야를 더욱 건강하고 풍요롭게 만들며 발전의 원동력이 되었음을 역사는 보여준다.
둘째, 진정한 기술적 돌파구는 두 가지 요소의 결합에서 비롯된다. 하나는 기존 방법론의 한계를 파고드는 깊이 있는 이론적, 수학적 분석(예: 그래디언트 소실 문제 규명)이며, 다른 하나는 기존의 지배적인 사고 틀 자체를 의심하고 깨뜨리려는 과감한 철학적 도전(예: “표상 없는 지능”)이다. 1991년은 이러한 지적 역동성이 가장 폭발적으로 나타난 해 중 하나로, 기초 연구의 중요성과 패러다임 전환의 힘을 동시에 증명한 시기로 기억될 것이다. 당시의 아이디어들은 그 시대의 컴퓨팅 파워로는 온전히 구현하기 어려웠지만, 그 선구적인 통찰력은 수십 년의 시간을 뛰어넘어 현대 AI 시대를 여는 결정적인 유산이 되었다.
7. 참고 자료
- (PDF) Foundations of AI: The big issues - ResearchGate, https://www.researchgate.net/publication/222487653_Foundations_of_AI_The_big_issues
- Intelligence without representation* - People | MIT CSAIL, https://people.csail.mit.edu/brooks/papers/representation.pdf
- IAAI-91: The Third Conference on Innovative Applications of Artificial Intelligence - AAAI, https://aaai.org/conference/iaai/iaai91/
- AAAI-91: Ninth National Conference on Artificial Intelligence, https://aaai.org/conference/aaai/aaai91/
- AAAI-91: Ninth National Conference on Artificial Intelligence, https://auld.aaai.org/Conferences/AAAI/aaai91.php
- AAAI-91: Proceedings, Ninth National Conference on Artificial Intelligence, July 14-19, 1991, https://books.google.com/books/about/AAAI_91.html?id=myE9AQAAIAAJ
- AAAI 1991 Proceedings, https://auld.aaai.org/Press/Proceedings/aaai91.php
- Proceedings of the AAAI Conference on Artificial Intelligence, 9 Archives, https://aaai.org/proceeding/aaai-09-1991/
- IJCAI - 91: proceedings of the twelfth international conference on artificial intelligence, https://vslopac.iima.ac.in/bib/34824
- IJCAI 1991 - OpenReview, https://openreview.net/group?id=dblp.org/conf/IJCAI/1991
- Proceedings of the Twelfth International Joint Conference on Artificial Intelligence (I) - IJCAI, https://www.ijcai.org/proceedings/1991-1
-
- IJCAI 1991: Sydney, New South Wales, Australia - Fuzzy Logic and Fuzzy Control, https://sigmod.org/publications/dblp////db/conf/ijcai/ijcai1991fl.html
- Advances in Neural Information Processing Systems 4 (NIPS 1991), https://proceedings.neurips.cc/paper/1991
- Neural Information Processing Systems (NIPS) - SIGMOD, http://www.sigmod.org/publications/dblp/db/conf/nips/index.html
- 1991: First very deep learning with unsupervised pre-training. First neural network distillation., https://people.idsia.ch/~juergen/very-deep-learning-1991.html
- Sepp Hochreiter’s Fundamental Deep Learning Problem (1991) - IDSIA, https://www.idsia.ch/~juergen/fundamentaldeeplearningproblem.html
- Robotics and Automation, ’91 International Conference On - U.S. Department of Commerce, https://search.library.doc.gov/discovery/fulldisplay?docid=alma991000421647804716&context=L&vid=01USDOC_INST:01USDOC&lang=en&search_scope=MyInst_and_CI&adaptor=Local%20Search%20Engine&tab=Everything&query=creator%2Cexact%2CInstitute%20of%20Electrical%20and%20Electronics%20Engineers%20Computer%20Society%20Press%2CAND&facet=creator%2Cexact%2CInstitute%20of%20Electrical%20and%20Electronics%20Engineers%20Computer%20Society%20Press&mode=advanced&offset=40
- IEEE International Conference on Robotics and Automation : ICRA : [proceedings] - National Library of Medicine Institution - NLM Locator Plus, https://catalog.nlm.nih.gov/discovery/fulldisplay?docid=alma9915186383406676&context=L&vid=01NLM_INST:01NLM_INST&lang=en&adaptor=Local%20Search%20Engine&tab=LibraryCatalog&query=lds04%2Cexact%2C101518638
- Instrumented harmonic drives for robotic compliant maneuvers, https://bleex.me.berkeley.edu/wp-content/uploads/hel-media/Publication/ICRA.Instrumented%20Harmonic%20Drive.V3.04.1991.pdf
- Proceedings. 1991 IEEE International Conference on Robotics and Automation, https://www.computer.org/csdl/proceedings/robot/1991/12OmNzahbRb
- Behavior-based Robotics - University of Alberta Dictionary of Cognitive Science, http://www.bcp.psych.ualberta.ca/~mike/Pearl_Street/Dictionary/contents/B/behbasrob.html
- Behavior-based robotics - Wikipedia, https://en.wikipedia.org/wiki/Behavior-based_robotics
- A BRIEF INTRODUCTION TO BEHAVIOR-BASED ROBOTICS, https://baibook.epfl.ch/exercises/behaviorBasedRobotics/BBSummary.pdf
- Pioneers of Behavior-Based Robotics - The Mind Project, https://mind.ilstu.edu/curriculum/medical_robotics/behavior_pioneers.html
- Robot Architectures - Brown Computer Science, https://cs.brown.edu/people/tdean/courses/cs148/02/architectures.html
- Subsumption architecture - EIA, http://eia.udg.edu/~busquets/thesis/thesis_html/node13.html
- Subsumption architecture - Wikipedia, https://en.wikipedia.org/wiki/Subsumption_architecture
- MARVIN’s Head Pt 3 — Subsumption. continued from previous article … | by Gene Foxwell | Medium, https://medium.com/@genefoxwell/marvins-head-pt-3-subsumption-e434f7547215
- Object-Oriented Design of the Subsumption Architecture Greg Butler*, Andrea Gantchev, Peter Grogono Department of Computer Scien - IC-Unicamp, https://www.ic.unicamp.br/~esther/teaching/2018s2/mo651/OODesignOfTheSubsumption.pdf
- Rodney Brooks - Wikipedia, https://en.wikipedia.org/wiki/Rodney_Brooks
- Rodney Brooks “The Future of Innovation in Artificial Intelligence and Robotics” - YouTube, https://www.youtube.com/watch?v=4P_ZhwvA8kA
- Dr Rodney Brooks - Flinders University, https://www.flinders.edu.au/alumni/our-alumni/alumni-stories/dr-rodney-brooks
- How Brook’s Behavior-Based Robots Teach Us a Lesson About Knowledge - MDPI, https://www.mdpi.com/2504-3900/126/1/5
- Vanishing gradient problem - Wikipedia, https://en.wikipedia.org/wiki/Vanishing_gradient_problem
- Recurrent Neural Net Learning and Vanishing Gradient, https://www.bioinf.jku.at/publications/older/2904.pdf
- Deep Learning: Our Miraculous Year 1990-1991 - ResearchGate, https://www.researchgate.net/publication/341341839_Deep_Learning_Our_Miraculous_Year_1990-1991
- 1991: First very deep learning with unsupervised pre-training, https://people.idsia.ch/~juergen//very-deep-learning-1991-2021.html
- Jürgen Schmidhuber:The Father of Generative AI Without Turing Award - 甲子光年, https://www.jazzyear.com/article_info.html?id=1352
- NeurIPS 1991 Accepted Paper List - Paper Copilot, https://papercopilot.com/paper-list/neurips-paper-list/neurips-1991-paper-list/
- AI Agents: Evolution, Architecture, and Real-World Applications - arXiv, https://arxiv.org/html/2503.12687v1
- Learning Admissible Heuristics while Solving Problems - IJCAI, https://www.ijcai.org/Proceedings/91-1/Papers/030.pdf
- Anna Bramanti-Gregor - dblp, https://dblp.org/pid/54/3600
- Henry W. Davis’s research while affiliated with Wright State University and other places, https://www.researchgate.net/scientific-contributions/Henry-W-Davis-2163368499
- Where the Really Hard Problems Are - IJCAI, https://www.ijcai.org/Proceedings/91-1/Papers/052.pdf
- Advanced Robotics, 1991. ‘Robots in Unstructured Environments’, 91 ICAR., Fifth International Conference on - P K Kelkar Library, https://pkklib.iitk.ac.in/index.php/resources/journals/e-journals/17415:advanced-robotics-1991-robots-in-unstructured-environments-91-icar-fifth-international-conference-on
- Path planning for mobile manipulators for multiple task execution - Robotics and Automation, IEEE Transactions on, https://www.ri.cmu.edu/pub_files/pub3/carriker_w_f_1991_1/carriker_w_f_1991_1.pdf
- 1991-Programming Robots Using Reinforcement Learning and Teaching, https://cdn.aaai.org/AAAI/1991/AAAI91-122.pdf
- Robotics Research The International Journal of, [http://users.cis.fiu.edu/~iyengar/publication/J-(1991)%20-%20Trajectory%20Planning%20of%20Robot%20Manipulators%20in%20Noisy%20Workspaces%20Using%20Stochastic%20Automata%20-%20Journal%20of%20Robotic%20Research].pdf
- Who Invented Deep Residual Learning?, https://people.idsia.ch/~juergen/who-invented-residual-neural-networks.html
- (PDF) Behavior-based robotics, its scope and its prospects - ResearchGate, https://www.researchgate.net/publication/3774163_Behavior-based_robotics_its_scope_and_its_prospects