1261.7 행동 기반 로보틱스의 이론적 기초

1. 행동 기반 로보틱스의 정의와 철학적 배경

1.1 정의

행동 기반 로보틱스(behavior-based robotics)는 로봇의 지능적 행동이 환경과의 직접적 상호 작용을 통해 발현(emergence)되어야 한다는 원리에 기초한 로봇 제어 패러다임이다. 이 접근법에서 로봇의 전체 행동은 복수의 단순한 행동 모듈(behavior module)의 동시 작동과 상호 작용으로부터 생성되며, 중앙 집중적 세계 모델이나 상위 수준의 전역 계획을 명시적으로 요구하지 않는다.

Arkin(1998)은 행동 기반 로보틱스를 “센서 자극과 행동 반응 사이의 긴밀한 연결(tight coupling)에 기초하여 로봇 지능을 구현하는 접근법“으로 정의하였다. 이 정의는 행동 기반 접근이 전통적 심의형 접근과 근본적으로 상이한 인식론적 전제에 기초함을 함축한다.

1.2 철학적 배경: 상황적 인지

행동 기반 로보틱스의 이론적 기초는 인지 과학(cognitive science)과 생물학(biology)의 두 분야에서 유래한다.

인지 과학 측면에서, 행동 기반 접근은 상황적 인지(situated cognition)의 철학적 전통에 뿌리를 둔다. 상황적 인지는 지능이 추상적 기호 처리(symbol manipulation)가 아니라, 몸체(body)와 환경(environment) 사이의 구체적 상호 작용 속에서 발현된다는 관점이다. Heidegger의 ‘세계-내-존재(In-der-Welt-Sein)’ 개념과 Merleau-Ponty의 체화된 인지(embodied cognition) 이론이 그 철학적 근간을 이룬다.

Brooks(1991a)는 이러한 철학적 관점을 로봇공학에 직접적으로 적용하여, “지능은 표상(representation)에 있지 않다“는 명제를 제시하였다. 그는 전통적 인공지능이 가정하는 감지-모델링-계획-실행(SMPA) 파이프라인이 실세계 로봇에 불필요하며, 환경 자체가 가장 정확한 모델이라고 주장하였다.

2. 생물학적 영감: 동물 행동학

2.1 틴버겐의 본능적 행동 모델

행동 기반 로보틱스의 이론적 기초 중 하나는 동물 행동학(ethology)에서 유래한다. Tinbergen(1951)은 동물의 본능적 행동이 계층적으로 조직된 고정 행동 패턴(fixed action pattern, FAP)의 체계를 통해 생성됨을 관찰하였다. 각 FAP는 특정 자극(sign stimulus)에 의해 활성화되며, 일단 활성화되면 외부 자극의 지속적 입력 없이도 완결적으로 실행된다.

Tinbergen의 본능 모델에서 행동은 계층적 구조를 형성한다. 상위 수준의 행동(예: 둥지 짓기)은 하위 수준의 행동(예: 나뭇가지 운반, 배치)의 순차적 또는 조건적 실행을 통해 달성된다. 이 계층적 행동 조직 원리는 로봇공학에서 행동 제어의 계층적 구조 설계에 직접적 영감을 제공하였다.

2.2 브레이텐베르크의 차량 모델

Braitenberg(1984)는 사고 실험(thought experiment)을 통해, 센서와 액추에이터 사이의 단순한 직접 연결만으로도 외부 관찰자에게 공격성, 공포, 탐색 등의 ‘목적 지향적’ 행동으로 보이는 복잡한 행동 양식이 발현될 수 있음을 보였다. Braitenberg 차량(Braitenberg vehicle)으로 불리는 이 모델에서, 좌우 광센서와 좌우 모터 사이의 연결 방식(동측 연결, 교차 연결)과 연결의 극성(흥분성, 억제성)의 조합만으로 다양한 행동 레퍼토리가 생성된다.

이 사고 실험은 두 가지 핵심 원리를 시사한다. 첫째, 복잡한 행동이 반드시 복잡한 내부 기제를 요구하지 않는다(단순성의 원리). 둘째, 관찰된 행동의 ’목적성’은 외부 관찰자의 해석에 불과하며, 기제 자체에는 목적이나 의도가 내재하지 않는다(발현의 원리).

3. 핵심 이론적 원리

3.1 체화(Embodiment)

행동 기반 로보틱스의 첫 번째 핵심 원리는 체화(embodiment)이다. 이 원리는 지능적 행동의 생성에 물리적 신체(physical body)가 필수적이라는 주장이다. Pfeifer와 Scheier(1999)는 체화를 통해 로봇이 환경과의 물리적 상호 작용으로부터 간접적 연산(morphological computation)을 수행할 수 있음을 보였다.

체화의 원리에 따르면, 로봇의 행동은 제어 소프트웨어만으로 결정되는 것이 아니라, 신체의 물리적 형태(morphology), 재료 특성, 센서 배치, 관절 구조 등의 물리적 속성에 의해 본질적으로 제약되고 형성된다. 예를 들어, 수동적 동적 보행기(passive dynamic walker)는 제어 입력 없이 경사면에서 안정적 보행을 수행하며, 이는 기계적 구조 자체가 보행 행동을 암묵적으로 연산하고 있음을 보여준다.

3.2 상황성(Situatedness)

두 번째 원리는 상황성(situatedness)이다. 이 원리는 로봇이 실제 물리적 환경에 직접 위치하여(situated), 실시간으로 환경과 상호 작용하여야 한다는 요구이다. 시뮬레이션이나 추상적 모델 위에서의 추론이 아닌, 실세계의 물리적 제약(중력, 마찰, 조명 변화, 센서 잡음 등) 속에서의 작동이 강조된다.

Brooks(1991b)는 상황성의 원리를 다음과 같이 요약하였다: “세계는 그 자체가 가장 좋은 모델이다(The world is its own best model).” 이 명제는 내부 세계 모델의 구축이 불필요하거나 해로울 수 있으며, 센서를 통한 환경 직접 참조가 모델 기반 추론보다 효율적이고 정확하다는 주장을 담고 있다.

3.3 발현(Emergence)

세 번째 원리는 발현(emergence)이다. 행동 기반 로보틱스에서, 로봇의 전체적 행동(global behavior)은 개별 행동 모듈의 단순한 총합이 아니라, 복수의 행동 모듈과 환경 사이의 동적 상호 작용으로부터 발현되는 창발적 현상이다. 각 행동 모듈은 독립적으로 설계되며, 전체 시스템 수준의 행동은 명시적으로 프로그래밍되지 않고 상호 작용의 결과로 나타난다.

발현의 원리는 복잡계 이론(complexity theory)에서의 자기 조직화(self-organization) 개념과 밀접한 관련이 있다. Kauffman(1993)이 제시한 “질서의 무상 생성(order for free)” 개념에서와 같이, 단순한 규칙을 따르는 다수의 요소가 상호 작용하면 설계되지 않은 거시적 패턴이 출현할 수 있다.

4. 행동의 형식적 정의

4.1 센서-행동 매핑으로서의 행동

행동 기반 로보틱스에서 행동(behavior)은 센서 공간(sensor space) $\mathcal{S}$ 에서 행동 공간(action space) $\mathcal{A}$ 로의 매핑으로 형식화된다.

$\beta: \mathcal{S} \rightarrow \mathcal{A}$

이 매핑은 무상태(stateless)일 수도 있고, 내부 상태 $\mathcal{X}$ 에 의존하는 상태 의존적(stateful) 함수일 수도 있다. 무상태 행동은 순수 반응적(purely reactive) 행동에 해당하며, 상태 의존적 행동은 과거 경험이나 내부 변수의 유지를 허용하는 확장된 반응적 행동에 해당한다.

4.2 행동의 자극-반응 구조

각 행동은 활성화 조건(activation condition)과 행동 출력(action output)의 쌍으로 구성된다. 활성화 조건 $c_\beta(\mathbf{o})$ 는 센서 관측 $\mathbf{o}$ 에 대한 술어(predicate)로서, 해당 조건이 참(true)일 때 행동이 활성화된다.

$\beta(\mathbf{o}) = \begin{cases} f_\beta(\mathbf{o}) & \text{if } c_\beta(\mathbf{o}) = \text{true} \\ \text{inactive} & \text{otherwise} \end{cases}$

이 구조는 Tinbergen의 고정 행동 패턴에서의 신호 자극(sign stimulus) 개념과 직접적으로 대응한다.

5. 행동 조정 메커니즘

5.1 경쟁적 방법: 중재(Arbitration)

다수의 행동이 동시에 활성화되는 경우, 최종 행동 출력을 결정하기 위한 조정 메커니즘이 필수적이다. 경쟁적 조정(competitive coordination) 방법에서는 활성화된 행동 중 하나만이 선택되어 액추에이터를 배타적으로 제어한다. 선택 기준에는 고정 우선순위(fixed priority), 동적 우선순위, 승자 독식(winner-take-all) 등이 있다.

Brooks(1986)의 포섭 아키텍처에서 사용되는 억제(suppression)와 금지(inhibition) 메커니즘이 경쟁적 조정의 대표적 사례이다. 상위 층의 행동이 하위 층의 행동 출력을 억제하거나 센서 입력을 차단함으로써 제어권을 획득한다.

5.2 협력적 방법: 합산(Fusion)

협력적 조정(cooperative coordination) 방법에서는 활성화된 모든 행동의 출력이 합산 또는 가중 결합되어 최종 행동 명령을 생성한다. Arkin(1989)의 운동 스키마(motor schema) 접근이 대표적이며, 각 스키마의 벡터 출력이 가중 합산된다.

$\mathbf{a}(t) = \sum_{i=1}^{N} w_i \cdot \boldsymbol{\beta}_i\bigl(\mathbf{o}(t)\bigr)$

협력적 방법은 다수의 목표를 동시에 추구하는 유연한 행동 생성을 가능하게 하나, 상충하는 행동 벡터가 상쇄되어 교착 상태(deadlock)가 발생할 수 있다는 한계를 갖는다.

6. 행동 기반 접근의 이론적 한계

6.1 행동 설계의 비체계성

행동 기반 로보틱스의 주요 이론적 한계 중 하나는, 개별 행동 모듈의 설계와 행동 조합 방식의 결정이 체계적 방법론이 아닌 설계자의 직관과 경험에 의존한다는 점이다. 개별 행동은 비교적 단순하게 설계할 수 있으나, 다수의 행동이 조합될 때 발현되는 전체 행동을 사전에 예측하거나 보장하는 형식적 방법이 부족하다.

Mataric(1992)은 이를 “행동 기반 시스템의 분석과 디버깅이 전체론적(holistic) 특성으로 인해 본질적으로 어렵다“고 지적하였다.

6.2 복합 임무 수행의 한계

발현에 의존하는 행동 생성은 장기적이고 순차적인 복합 임무의 체계적 수행에 한계를 드러낸다. 순수 행동 기반 시스템에서는 “A를 수행한 후 B를 수행하라“는 명시적 순서 제약을 표현하기 어려우며, 이 한계가 혼합형 아키텍처로의 발전을 촉진한 주요 요인 중 하나이다.

6.3 행동 기반 접근과 현대 로봇 시스템

이러한 한계에도 불구하고, 행동 기반 로보틱스의 핵심 원리—체화, 상황성, 발현, 센서-행동 간 긴밀한 연결—는 현대 로봇 시스템의 반응 계층 설계에 근본적 영향을 미치고 있다. 혼합형 3계층 아키텍처에서 반응 계층의 행동 모듈은 행동 기반 로보틱스의 원리에 따라 설계되며, 상위의 실행 관리 계층과 심의 계층이 행동 기반 접근의 한계를 보완한다.

참고 문헌

Arkin, R. C. (1989). “Motor Schema–Based Mobile Robot Navigation.” International Journal of Robotics Research, 8(4), 92–112.
Arkin, R. C. (1998). Behavior-Based Robotics. MIT Press.
Braitenberg, V. (1984). Vehicles: Experiments in Synthetic Psychology. MIT Press.
Brooks, R. A. (1986). “A Robust Layered Control System for a Mobile Robot.” IEEE Journal on Robotics and Automation, 2(1), 14–23.
Brooks, R. A. (1991a). “Intelligence Without Representation.” Artificial Intelligence, 47(1–3), 139–159.
Brooks, R. A. (1991b). “Intelligence Without Reason.” Proceedings of the 12th International Joint Conference on Artificial Intelligence (IJCAI), 569–595.
Kauffman, S. A. (1993). The Origins of Order: Self-Organization and Selection in Evolution. Oxford University Press.
Mataric, M. J. (1992). “Integration of Representation into Goal-Driven Behavior-Based Robots.” IEEE Transactions on Robotics and Automation, 8(3), 304–312.
Pfeifer, R., & Scheier, C. (1999). Understanding Intelligence. MIT Press.
Tinbergen, N. (1951). The Study of Instinct. Oxford University Press.