2.19 윌리엄 로스 애시비의 동종 평형 장치(Homeostat)

1. 애시비의 학문적 배경

윌리엄 로스 애시비(William Ross Ashby, 1903–1972)는 영국의 정신의학자(Psychiatrist)이자 사이버네틱스 연구자로서, 적응적 체계(Adaptive System)의 수학적 이론에 핵심적 기여를 하였다. 애시비는 뇌를 자기 조직화 기계(Self-Organizing Machine)로 이해하는 관점을 발전시켰으며, 이 관점을 물리적 장치로 구현한 것이 동종 평형 장치(Homeostat)이다.

2. 동종 평형 장치의 구조

동종 평형 장치는 애시비가 1948년에 구축하고 1952년 저서 “Design for a Brain: The Origin of Adaptive Behaviour“에서 상세히 기술한 전기 기계식(Electromechanical) 장치이다.

2.1 물리적 구성

동종 평형 장치는 4개의 동일한 단위(Unit)로 구성되며, 각 단위는 다음의 요소를 포함한다:

자석-코일 시스템: 전류에 의해 회전하는 자석으로서, 장치의 주요 변수(출력)를 나타낸다. 자석의 회전 위치가 단위의 현재 상태이다.
전위차계(Potentiometer): 자석의 위치에 의해 조절되는 가변 저항으로, 출력 전압을 생성한다.
상호 연결: 각 단위의 출력이 다른 모든 단위의 입력에 연결된다. 4개의 단위가 완전 연결(Fully Connected)되어 있다.
유니셀렉터(Uniselector): 핵심적 적응 메커니즘으로, 25개의 서로 다른 피드백 연결 구성(Configuration) 중 하나를 선택하는 무작위 스위칭 장치이다.

2.2 동작 원리

동종 평형 장치의 동작은 두 수준으로 구분된다:

1차 피드백(Primary Feedback): 4개의 단위가 상호 연결되어 연속적으로 상호작용한다. 각 단위의 출력이 다른 단위의 입력에 영향을 미치며, 이 상호 피드백에 의해 체계의 전체적 동작이 결정된다.

2차 피드백(Secondary Feedback, 적응): 각 단위의 주요 변수가 미리 정해진 허용 범위(Critical Limits)를 벗어나면, 유니셀렉터가 작동하여 피드백 연결의 구성을 무작위로 변경한다. 이 구성 변경은 새로운 피드백 연결 구성이 체계를 안정 상태(모든 변수가 허용 범위 내)로 수렴시킬 때까지 반복된다.

2.3 적응의 메커니즘

동종 평형 장치의 적응은 무작위 탐색(Random Search)에 기반한다. 체계가 불안정해지면 유니셀렉터가 새로운 구성을 무작위로 시도하며, 안정적 구성이 발견되면 체계가 그 구성에 머무른다. 이 과정은 무작위적 시행착오(Trial and Error)에 의한 적응이며, 외부로부터의 설계나 지시 없이 체계 자체가 안정적 동작 모드를 발견하는 자기 조직화의 형태이다.

3. “Design for a Brain” (1952)

애시비의 저서 “Design for a Brain: The Origin of Adaptive Behaviour“는 적응적 행동의 기원을 기계론적(Mechanistic) 관점에서 설명하려는 체계적 시도이다.

3.1 초안정성(Ultrastability)

애시비는 동종 평형 장치의 적응 메커니즘을 초안정성(Ultrastability)이라는 개념으로 일반화하였다. 초안정 체계는 두 수준의 피드백을 갖는 체계이다:

1차 수준: 연속적 변수들의 상호작용에 의한 동적 행동
2차 수준: 1차 수준의 행동이 안정적이지 않을 때 활성화되는, 체계의 구조적 매개변수를 변경하는 적응 메커니즘

초안정 체계는 환경의 변화에 의해 불안정해질 때, 2차 수준의 적응 메커니즘이 활성화되어 새로운 안정적 구성을 탐색한다. 이 탐색이 성공하면 체계는 새로운 환경에 적응한 안정 상태에 도달한다.

4. 필수 다양성의 법칙(Law of Requisite Variety)

애시비는 1956년 저서 “An Introduction to Cybernetics“에서 필수 다양성의 법칙(Law of Requisite Variety)을 제시하였다. 이 법칙은 다음과 같이 정식화된다:

환경의 교란(Disturbance)에 의한 체계 출력의 변동을 제어하기 위해, 조절기(Regulator)는 적어도 환경의 교란만큼의 다양성(Variety)을 가져야 한다.

형식적으로, 환경의 교란이 $D$ 가지 상이한 형태를 취할 수 있을 때, 체계의 출력을 일정하게 유지하려면 조절기가 적어도 $D$ 가지 상이한 조절 작용을 수행할 수 있어야 한다.

정보 이론적으로 표현하면:

$H(E) \leq H(R) + H(E \vert R)$

여기서 $H(E)$ 는 조절 후 출력의 엔트로피, $H(R)$ 은 조절기의 엔트로피, $H(E \vert R)$ 은 조절기가 주어졌을 때의 조건부 엔트로피이다. 출력의 엔트로피를 최소화하려면 조절기의 다양성이 교란의 다양성을 상쇄해야 한다.

이 법칙은 “오직 다양성만이 다양성을 파괴할 수 있다(Only variety can destroy variety)“로 요약되며, 제어 체계의 설계에서 근본적 제약 조건을 제시한다.

동종 평형 장치의 학문적 의의

인공지능에 대한 함의

동종 평형 장치는 학습과 적응 능력을 갖춘 초기의 물리적 기계 중 하나이다. 동종 평형 장치의 적응 메커니즘—불안정성에 의해 촉발되는 무작위 탐색과 안정성에 의한 선택—은 진화적 적응(Evolutionary Adaptation)의 기본 원리와 구조적으로 유사하며, 현대의 진화 전략(Evolution Strategy)과 무작위 탐색 기반 최적화의 선구적 물리적 구현이다.

강화 학습과의 연관

동종 평형 장치의 적응은 보상 신호(안정성) 없이 페널티 신호(불안정성)에 의해 구동되는 적응으로 해석할 수 있다. 이는 현대 강화 학습에서 보상(Reward)과 처벌(Penalty)에 의한 정책 갱신의 초기 형태이다.

자기 조직화 비판의 출발점

동종 평형 장치의 무작위 탐색 기반 적응은 효율성의 관점에서 한계를 가지며, 이 한계의 인식이 보다 효율적인 학습 알고리즘(경사 하강법, 역전파 등)의 발전을 촉진하였다.

애시비의 동종 평형 장치와 초안정성 이론은 적응적 기계의 원리를 최초로 물리적으로 실증한 성과로서, 적응적 지능 체계의 설계에 관한 이론적 틀을 제공하였다.