2.2 행동주의 심리학의 등장과 자극-반응 모델

1. 행동주의의 등장 배경

행동주의(Behaviorism)는 20세기 초반에 등장한 심리학적 패러다임으로서, 심리학을 주관적 내성(Introspection)에 기반한 학문에서 객관적 관찰과 실험에 기반한 자연 과학으로 전환하고자 하였다. 행동주의의 등장은 19세기 후반의 구성주의 심리학(Structuralism)과 기능주의 심리학(Functionalism)에 대한 방법론적 비판에서 출발하였다.

분트(Wilhelm Wundt)가 1879년 라이프치히에 설립한 최초의 심리학 실험실에서 시작된 구성주의 심리학은 내성법(Introspective Method)을 통해 의식 경험의 구성 요소를 분석하고자 하였다. 그러나 내성법은 관찰자 간 일치도(Inter-Observer Reliability)가 낮고, 결과의 재현성(Reproducibility)이 부족하다는 방법론적 비판에 직면하였다.

2. 존 왓슨과 행동주의 선언

존 브로더스 왓슨(John Broadus Watson, 1878–1958)은 1913년 “Psychology as the Behaviorist Views It“를 발표하여 행동주의를 공식적으로 선언하였다. 이 논문에서 왓슨은 다음의 핵심 주장을 제시하였다:

심리학은 행동의 과학이어야 하며, 의식의 과학이 아니다.
심리학의 연구 대상은 관찰 가능한 행동(Observable Behavior)이어야 한다.
내성법은 과학적 방법으로 부적합하며, 객관적 실험 방법으로 대체되어야 한다.
정신 상태, 의식, 주관적 경험에 대한 참조는 과학적 심리학에서 배제되어야 한다.

왓슨에게 심리학의 목표는 자극(Stimulus)과 반응(Response) 사이의 법칙적 관계를 발견하는 것이다. 주어진 자극이 어떤 반응을 산출하는지, 그리고 주어진 반응이 어떤 자극에 의해 야기되는지를 예측하고 통제하는 것이 심리학의 과업이다.

3. 자극-반응(S-R) 모델

행동주의의 기본 분석 단위는 자극-반응(Stimulus-Response, S-R) 연합이다. 이 모델에서 유기체(Organism)는 환경으로부터 자극(S)을 수용하고, 이에 대한 반응(R)을 산출하는 체계로 간주된다.

3.1 고전적 조건 형성(Classical Conditioning)

파블로프(Ivan Pavlov, 1849–1936)의 고전적 조건 형성(Classical Conditioning) 실험은 행동주의의 핵심 실험적 기반을 제공하였다. 파블로프는 개의 타액 분비 반사를 연구하는 과정에서, 원래 타액 분비를 유발하지 않는 중성 자극(종소리)이 무조건 자극(음식)과 반복적으로 짝지어지면, 중성 자극만으로도 타액 분비가 유발됨을 발견하였다.

이 과정의 형식적 구조:

무조건 자극(Unconditioned Stimulus, US): 음식
무조건 반응(Unconditioned Response, UR): 타액 분비
조건 자극(Conditioned Stimulus, CS): 종소리
조건 반응(Conditioned Response, CR): 종소리에 의한 타액 분비

고전적 조건 형성의 핵심 원리는 시간적 인접(Temporal Contiguity)에 의한 연합 학습(Associative Learning)이다. CS와 US가 시간적으로 인접하여 반복 제시되면, CS와 UR 사이에 새로운 연합이 형성된다.

3.2 조작적 조건 형성(Operant Conditioning)

손다이크(Edward Thorndike, 1874–1949)의 효과의 법칙(Law of Effect)과 스키너(B.F. Skinner, 1904–1990)의 조작적 조건 형성은 행동주의의 두 번째 핵심 학습 메커니즘을 제공한다. 조작적 조건 형성에서 유기체의 행동은 그 행동의 결과(Consequence)에 의해 강화(Reinforcement)되거나 약화(Punishment)된다.

양의 강화(Positive Reinforcement): 행동 후 보상이 주어지면 행동 빈도가 증가한다.
음의 강화(Negative Reinforcement): 행동 후 혐오 자극이 제거되면 행동 빈도가 증가한다.
양의 처벌(Positive Punishment): 행동 후 혐오 자극이 주어지면 행동 빈도가 감소한다.
음의 처벌(Negative Punishment): 행동 후 보상이 제거되면 행동 빈도가 감소한다.

스키너는 조작적 조건 형성의 원리로 복잡한 행동 패턴을 설명할 수 있다고 주장하였다. 행동 형성(Shaping)은 목표 행동에 점진적으로 접근하는 행동을 선택적으로 강화함으로써, 유기체가 원래 산출하지 않던 복잡한 행동을 학습하게 하는 절차이다.

4. 스키너의 급진적 행동주의

스키너의 급진적 행동주의(Radical Behaviorism)는 왓슨의 방법론적 행동주의를 더욱 극단적으로 발전시킨 것이다. 스키너는 내적 정신 상태(믿음, 욕구, 의도 등)를 행동의 원인으로 상정하는 것을 거부하고, 모든 행동을 환경적 자극과 강화 이력(Reinforcement History)에 의해 설명할 수 있다고 주장하였다.

스키너의 “Verbal Behavior”(1957)는 인간 언어를 조작적 조건 형성의 원리로 설명하려는 시도이다. 언어 행동을 화자의 강화 이력에 의해 형성된 조작적 반응으로 분석하였다.

5. 행동주의와 인공지능의 관계

행동주의는 인공지능 연구와 복잡한 관계를 갖는다.

첫째, 행동주의의 외적 관찰 가능한 행동에의 초점은 튜링 테스트(Turing Test)의 방법론과 유사하다. 튜링 테스트는 기계의 내적 과정이 아닌 외적으로 관찰 가능한 행동적 구별 불가능성을 지능의 판별 기준으로 삼는다.

둘째, 조건 형성의 원리—특히 조작적 조건 형성의 보상과 처벌 메커니즘—는 현대 강화 학습(Reinforcement Learning)의 직접적 개념적 원천이다. 에이전트가 환경과 상호작용하며 보상 신호를 최대화하는 행동 정책을 학습하는 강화 학습의 구조는 조작적 조건 형성의 S-R-강화 구조와 동형이다.

셋째, 행동주의의 한계—내적 표상과 처리 과정의 무시—는 기호주의 인공지능과 인지 과학의 등장을 촉진한 원인이기도 하다. 행동주의가 설명하지 못하는 인지 현상에 대한 대안으로서 정보 처리 모델이 제안되었다.