396.85 심볼릭 AI(Symbolic AI)와 서브심볼릭 AI의 임무 해석 연계

1. 심볼릭 AI와 서브심볼릭 AI의 구분

1.1 심볼릭 AI의 정의와 특성

심볼릭 AI(Symbolic AI)는 지식을 명시적 기호(symbol)와 그 관계로 표현하고, 논리적 규칙(logical rule)에 따라 추론(reasoning)을 수행하는 인공지능 패러다임이다. 고전적 인공지능(Good Old-Fashioned AI, GOFAI)으로도 불리며, 1950년대부터 1980년대까지 AI 연구의 주류를 형성하였다.

심볼릭 AI의 핵심 구성 요소는 다음과 같다.

기호 표현(Symbolic Representation): 세계의 상태, 객체, 관계를 명시적 기호로 인코딩한다. 예를 들어, on(block_A, table), holding(robot, block_B) 등의 술어(predicate)를 사용한다.
규칙 기반 추론(Rule-Based Reasoning): if-then 형태의 규칙을 적용하여 새로운 지식을 유도한다.
탐색 기반 계획(Search-Based Planning): 목표 상태를 달성하기 위한 행동 시퀀스를 상태 공간(state space)의 탐색을 통해 구한다.
형식 논리(Formal Logic): 명제 논리(propositional logic), 1차 술어 논리(first-order predicate logic), 시간 논리(temporal logic) 등을 활용한다.

로봇 임무 관리에서 심볼릭 AI는 PDDL 기반 자동 계획(automated planning), 계층적 작업 네트워크(HTN), 상태 머신, 행동 트리 등의 형태로 광범위하게 활용되어 왔다.

1.2 서브심볼릭 AI의 정의와 특성

서브심볼릭 AI(Sub-Symbolic AI)는 명시적 기호가 아닌 수치적 매개변수(numerical parameters)를 통해 지식을 암묵적으로 인코딩하는 패러다임이다. 심층 신경망(Deep Neural Network, DNN), 강화 학습(Reinforcement Learning, RL), 대규모 언어 모델(LLM) 등이 이에 해당한다.

서브심볼릭 AI의 핵심 특성은 다음과 같다.

분산 표현(Distributed Representation): 지식이 신경망의 가중치(weight)에 걸쳐 분산적으로 인코딩된다.
패턴 인식(Pattern Recognition): 대량의 데이터로부터 패턴을 학습하며, 시각 인식, 음성 인식, 자연어 처리 등에서 탁월한 성능을 보인다.
일반화(Generalization): 학습 데이터에 포함되지 않은 새로운 입력에 대해서도 합리적인 출력을 생성할 수 있다.
암묵적 추론(Implicit Reasoning): 명시적 규칙이 아닌 학습된 가중치를 통해 추론을 수행한다.

1.3 두 패러다임의 비교

특성	심볼릭 AI	서브심볼릭 AI
지식 표현	명시적 기호, 규칙	수치적 매개변수
추론 방식	논리적, 연역적	통계적, 패턴 기반
해석 가능성	높음 (투명함)	낮음 (불투명함)
환경 인식	취약 (센서 입력 직접 처리 어려움)	강력 (원시 센서 데이터 처리 가능)
일반화	제한적 (규칙 범위 내)	우수 (학습 데이터 분포 내)
안전성 검증	형식 검증 가능	형식 검증 어려움
도메인 지식	수동 인코딩 필요	데이터로부터 학습
계획 능력	강력 (최적성 보장 가능)	제한적 (장기 계획에 취약)

2. 신경-심볼릭 통합(Neuro-Symbolic Integration)의 필요성

로봇 임무 관리에서 심볼릭 AI와 서브심볼릭 AI 각각의 한계는 두 패러다임의 통합, 즉 신경-심볼릭 AI(Neuro-Symbolic AI)의 필요성을 강하게 시사한다(Garcez et al., 2019).

심볼릭 AI만으로는 다음과 같은 한계에 직면한다.

기호 기반 문제(Symbol Grounding Problem): 추상적 기호와 실제 센서 데이터 간의 연결이 자동으로 이루어지지 않는다.
수동 지식 공학(Knowledge Engineering Bottleneck): 도메인 지식을 수동으로 형식화하는 과정이 노동 집약적이다.
비구조적 환경 대응의 어려움: 예측하지 못한 환경 변화에 대한 적응력이 부족하다.

서브심볼릭 AI만으로는 다음과 같은 한계에 직면한다.

장기 계획(Long-Horizon Planning)의 어려움: 수십 단계 이상의 장기 과업 시퀀스를 생성하기 어렵다.
해석 불가능성(Opacity): 임무 관리 시스템의 의사 결정 과정을 운영자가 이해하고 검증하기 어렵다.
안전성 보장의 어려움: 형식적 안전 속성의 만족을 보장할 수 없다.

이러한 상호 보완적 한계로 인하여, 효과적인 로봇 임무 관리 시스템은 두 패러다임의 강점을 결합하는 방향으로 발전하고 있다.

3. 신경-심볼릭 임무 해석의 아키텍처

3.1 계층적 통합 아키텍처

신경-심볼릭 임무 해석의 가장 보편적인 아키텍처는 계층적 통합(hierarchical integration) 구조이다. 이 구조에서 서브심볼릭 구성 요소는 주로 하위 계층(인식, 저수준 제어)을 담당하고, 심볼릭 구성 요소는 상위 계층(임무 계획, 의사 결정)을 담당한다.

상위 계층: 심볼릭 AI
    ├── 임무 계획 (PDDL, HTN)
    ├── 논리적 추론
    ├── 제약 조건 검증
    └── 임무 모니터링

인터페이스 계층: 기호 기반(Symbol Grounding)
    ├── 객체 인식 결과 → 심볼릭 술어 변환
    ├── 심볼릭 행동 명령 → 모터 제어 매개변수 변환
    └── 센서 이벤트 → 논리적 이벤트 매핑

하위 계층: 서브심볼릭 AI
    ├── 시각 인식 (CNN, ViT)
    ├── 자연어 이해 (LLM, Transformer)
    ├── 동작 제어 (강화 학습, 모방 학습)
    └── 장애물 회피 (반응적 제어)

이 아키텍처에서 핵심적인 구성 요소는 인터페이스 계층이다. 이 계층은 서브심볼릭 표현과 심볼릭 표현 간의 양방향 변환을 수행한다.

3.2 기호 기반 인터페이스(Symbol Grounding Interface)

기호 기반 인터페이스는 다음 두 가지 방향의 변환을 수행한다.

상향 변환(Perception to Symbol): 서브심볼릭 인식 결과를 심볼릭 술어로 변환한다.

$f_{\text{ground}}^{\uparrow}: \mathcal{Z} \rightarrow \mathcal{S}$

여기서 $\mathcal{Z}$ 는 센서 관측 공간, $\mathcal{S}$ 는 심볼릭 상태 공간이다. 예를 들어, 객체 탐지 신경망의 출력 {class: "cup", bbox: [120, 340, 180, 400], conf: 0.95}를 심볼릭 술어 on(cup_1, table_A)로 변환한다.

하향 변환(Symbol to Action): 심볼릭 행동 명령을 서브심볼릭 제어 입력으로 변환한다.

$f_{\text{ground}}^{\downarrow}: \mathcal{A}_{\text{sym}} \rightarrow \mathcal{A}_{\text{sub}}$

여기서 $\mathcal{A}_{\text{sym}}$ 은 심볼릭 행동 공간(예: pick_up(cup_1)), $\mathcal{A}_{\text{sub}}$ 는 서브심볼릭 행동 공간(예: 매니퓰레이터의 관절 궤적)이다. 이 변환은 학습 기반 기술 정책(skill policy)에 의해 구현된다.

3.3 병렬 통합 아키텍처

병렬 통합(parallel integration) 아키텍처에서는 심볼릭 모듈과 서브심볼릭 모듈이 동등한 수준에서 동시에 작동하며, 중재 모듈(arbitration module)이 두 모듈의 출력을 종합하여 최종 의사 결정을 수행한다.

$a^* = \text{Arbitrate}\left(a_{\text{sym}}, a_{\text{sub}}, w_{\text{sym}}, w_{\text{sub}}\right)$

여기서 $a_{\text{sym}}$ 과 $a_{\text{sub}}$ 는 각각 심볼릭 모듈과 서브심볼릭 모듈의 제안 행동, $w_{\text{sym}}$ 과 $w_{\text{sub}}$ 는 상황에 따른 가중치이다. 환경이 구조화되어 있고 예측 가능할 때는 심볼릭 모듈의 가중치가 증가하고, 환경이 비구조적이고 불확실할 때는 서브심볼릭 모듈의 가중치가 증가한다.

4. 핵심 연계 기법

4.1 신경 기호 기반(Neural Symbol Grounding)

신경 기호 기반(Neural Symbol Grounding)은 신경망을 활용하여 원시 센서 데이터로부터 심볼릭 상태 표현을 자동으로 추출하는 기법이다. 이 기법의 주요 방법론은 다음과 같다.

객체 중심 표현(Object-Centric Representation):
센서 데이터로부터 개별 객체를 분리하여 인식하고, 각 객체에 대한 속성(attribute)과 관계(relation)를 추출한다. Slot Attention(Locatello et al., 2020), SPACE(Lin et al., 2020) 등의 기법이 이에 해당한다.

술어 학습(Predicate Learning):
라벨링된 데이터로부터 심볼릭 술어에 대응하는 분류기(classifier)를 자동으로 학습한다.

$P(\text{on}(o_i, o_j) \mid I) = \sigma(f_\theta(z_i, z_j))$

여기서 $z_i$ , $z_j$ 는 객체 $o_i$ , $o_j$ 의 잠재 표현(latent representation), $f_\theta$ 는 학습된 관계 분류기, $\sigma$ 는 시그모이드 함수이다.

4.2 심볼릭 강화 학습(Symbolic Reinforcement Learning)

심볼릭 강화 학습은 강화 학습의 프레임워크 내에서 심볼릭 지식을 활용하는 기법이다. 주요 접근법은 다음과 같다.

옵션 프레임워크(Options Framework):
Sutton et al.(1999)이 제안한 옵션(option)은 시간적으로 확장된 행동(temporally extended action)을 나타내며, 이는 심볼릭 수준의 과업에 대응된다. 각 옵션 $o = (\mathcal{I}, \pi, \beta)$ 는 시작 조건(initiation set) $\mathcal{I}$ , 정책 $\pi$ , 종료 조건 $\beta$ 로 구성된다. 심볼릭 계층에서 옵션의 시퀀스를 계획하고, 서브심볼릭 계층에서 각 옵션의 정책을 강화 학습으로 학습한다.

기호 보상 함수(Symbolic Reward Function):
시간 논리(temporal logic) 기반의 기호 명세로부터 강화 학습의 보상 함수를 자동으로 생성한다. LTL(Linear Temporal Logic) 속성 $\phi$ 로부터 보상 함수 $R_\phi(s, a)$ 를 도출한다.

$R_\phi(s, a) = \begin{cases} +1 & \text{if trace}(s, a) \models \phi \\ -1 & \text{if trace}(s, a) \models \neg\phi \\ 0 & \text{otherwise} \end{cases}$

4.3 차별화 가능 계획(Differentiable Planning)

차별화 가능 계획(differentiable planning)은 심볼릭 계획 알고리즘을 미분 가능(differentiable)한 형태로 재구현하여, 역전파(backpropagation)를 통해 end-to-end 학습이 가능하도록 하는 접근법이다(Toyer et al., 2020). 이 접근법의 장점은 심볼릭 계획의 구조적 이점(장기 계획 능력, 조합적 일반화)과 신경망의 학습 능력을 동시에 활용할 수 있다는 것이다.

$\pi^* = \arg\min_\theta \mathcal{L}\left(\text{DiffPlan}(s_0, g; \theta), \pi_{\text{expert}}\right)$

여기서 $\text{DiffPlan}$ 은 미분 가능 계획기, $\pi_{\text{expert}}$ 는 전문가 정책이다.

5. 임무 관리에의 적용 사례

5.1 NeSy 기반 임무 모니터링

신경-심볼릭(NeSy) 접근법을 임무 모니터링에 적용하는 사례에서는 다음과 같은 구조가 활용된다.

서브심볼릭 층: 카메라 영상으로부터 현재 임무 상태를 인식한다 (예: 객체의 위치, 로봇의 자세).
심볼릭 층: 인식된 상태를 심볼릭 술어로 변환하고, 현재 상태가 임무 명세의 기대 상태와 일치하는지 논리적으로 검증한다.
이상 탐지: 심볼릭 수준에서 기대 상태와 실제 상태 간의 불일치가 탐지되면, 임무 재계획이나 비상 절차를 발동한다.

5.2 NeSy 기반 적응적 과업 선택

서브심볼릭 환경 인식과 심볼릭 과업 계획의 결합을 통한 적응적 과업 선택은 다음과 같이 이루어진다.

$t^* = \arg\max_{t \in \mathcal{T}_{\text{feasible}}} \left[\underbrace{V_{\text{sym}}(t \mid s_{\text{sym}})}_{\text{심볼릭 유용도}} \cdot \underbrace{P_{\text{sub}}(t \mid z)}_{\text{서브심볼릭 실현 가능성}}\right]$

여기서 $V_{\text{sym}}(t \mid s_{\text{sym}})$ 는 심볼릭 상태에서의 과업 $t$ 의 유용도, $P_{\text{sub}}(t \mid z)$ 는 현재 센서 관측 $z$ 에 기반한 과업 실현 가능성이다. 이 구조는 SayCan 접근법의 일반화된 형태로 볼 수 있다.

6. 기술적 도전 과제

신경-심볼릭 임무 해석의 실용적 배치에서 다음과 같은 기술적 도전 과제가 존재한다.

표현 간 불일치(Representation Mismatch): 심볼릭 표현의 이산적·구조적 특성과 서브심볼릭 표현의 연속적·분산적 특성 간의 간극을 효율적으로 연결하기 어렵다.
오차 전파(Error Propagation): 서브심볼릭 인식 모듈의 오류가 심볼릭 추론 결과에 연쇄적으로 미치는 영향을 관리하여야 한다.
상태 공간 확장성(State Space Scalability): 복잡한 환경에서 심볼릭 상태 공간의 크기가 폭발적으로 증가하는 문제를 해결하여야 한다.
실시간 처리: 서브심볼릭 인식과 심볼릭 추론을 실시간으로 복합 수행하여야 하는 계산적 부담을 관리하여야 한다.
통합 학습(Integrated Learning): 심볼릭 규칙과 서브심볼릭 매개변수를 통합적으로 학습하는 효율적 기법의 개발이 필요하다.

7. 참고 문헌

Garcez, A. d., Gori, M., Lamb, L. C., et al. (2019). “Neural-Symbolic Computing: An Effective Methodology for Principled Integration of Machine Learning and Reasoning.” Journal of Applied Logics, 6(4), 611–632.
Locatello, F., Weissenborn, D., Unterthiner, T., et al. (2020). “Object-Centric Learning with Slot Attention.” Advances in Neural Information Processing Systems (NeurIPS).
Sutton, R. S., Precup, D., & Singh, S. (1999). “Between MDPs and Semi-MDPs: A Framework for Temporal Abstraction in Reinforcement Learning.” Artificial Intelligence, 112(1–2), 181–211.
Toyer, S., Thiébaux, S., Trevizan, F., & Xie, L. (2020). “ASNets: Deep Learning for Generalised Planning.” Journal of Artificial Intelligence Research, 68, 1–68.
Mao, J., Gan, C., Kohli, P., Tenenbaum, J. B., & Wu, J. (2019). “The Neuro-Symbolic Concept Learner: Interpreting Scenes, Words, and Sentences from Natural Supervision.” Proceedings of the International Conference on Learning Representations (ICLR).

본 절은 로봇공학 서적 Version 0.1에 해당하며, 신경-심볼릭 AI 연구의 발전에 따라 지속적으로 갱신될 예정이다.