Multi-Agent Systems (다중 에이전트 시스템)

Multi-Agent Systems (다중 에이전트 시스템)

2025-12-09, G30DR

1. 서론: 분산 지능과 집단적 문제 해결의 패러다임

현대 컴퓨터 과학과 인공지능(AI) 분야에서 다중 에이전트 시스템(Multi-Agent Systems, 이하 MAS)은 복잡계(Complex Systems)를 이해하고 제어하기 위한 핵심적인 패러다임으로 자리 잡았다. 전통적인 AI 연구가 단일 지능체(Single Agent)의 인지 능력 향상에 집중했다면, MAS는 자율적인 행위자들의 상호작용을 통해 발현되는 ’사회적 지능(Social Intelligence)’과 ’집단 지성(Collective Intelligence)’에 주목한다.

MAS는 중앙 집중식 제어 시스템이 갖는 병목 현상과 단일 실패 지점(Single Point of Failure)의 취약성을 극복하기 위한 대안으로 부상했다. 이는 거대한 문제를 작은 단위로 분해하고, 이를 해결할 수 있는 전문화된 에이전트들에게 할당함으로써 시스템 전체의 유연성(Flexibility), 견고성(Robustness), 그리고 확장성(Scalability)을 극대화하려는 시도이다.1

최근 대규모 언어 모델(LLM)의 비약적인 발전은 MAS 연구에 새로운 전기를 마련하고 있다. 텍스트 생성 도구로 여겨지던 LLM이 계획 수립(Planning)과 도구 사용(Tool Use) 능력을 갖춘 에이전트의 ‘두뇌’ 역할을 수행하게 되면서, MAS는 단순한 시뮬레이션을 넘어 소프트웨어 엔지니어링, 복잡한 데이터 분석, 그리고 자율 주행과 같은 실세계의 난제들을 해결하는 실질적인 프레임워크로 진화하고 있다.3 본 보고서는 MAS의 기초 이론부터 최신 아키텍처, 통신 프로토콜, 조정 메커니즘, 그리고 산업 응용에 이르기까지 해당 분야를 심층적으로 분석하고 종합한다.

2. 지능형 에이전트의 본질과 시스템 분류

2.1 지능형 에이전트의 정의 및 4대 핵심 특성

MAS를 구성하는 기본 단위인 ’에이전트(Agent)’는 환경(Environment) 내에 위치하며, 그 환경을 감지(Sensors)하고 환경의 상태를 변화시키기 위해 행동(Actuators)하는 연산 시스템으로 정의된다. 문헌 연구를 종합하면, 단순한 소프트웨어 프로그램과 구별되는 지능형 에이전트의 핵심 특성은 자율성, 반응성, 능동성, 사회성이라는 네 가지 기둥으로 구성된다.3

특성 (Characteristic)상세 정의 및 메커니즘 (Definition & Mechanism)시스템적 함의 (Systemic Implication)
자율성 (Autonomy)인간이나 타 에이전트의 직접적 간섭 없이 자신의 내부 상태와 경험에 근거하여 의사결정을 내리는 능력. 에이전트는 자신의 행동과 내부 상태에 대한 통제권을 갖는다.시스템의 분산 제어를 가능하게 하며, 개별 구성 요소의 오류가 전체 시스템 붕괴로 이어지는 것을 방지하는 결함 감수성(Fault Tolerance)의 기초가 된다.
반응성 (Reactivity)환경의 변화를 실시간으로 인지하고 이에 적절하게 대응하는 능력. 이는 자극-반응(Stimulus-Response) 루프를 포함한다.동적이고 예측 불가능한 환경에서 에이전트가 생존하고 임무를 수행하기 위한 필수 조건이다.
능동성 (Pro-activeness)단순히 환경에 반응하는 것을 넘어, 자신의 목표(Goal-directed behavior)를 달성하기 위해 주도적으로 행동을 개시하는 성질.에이전트가 단순한 서브루틴과 구별되는 결정적 특징으로, 장기적인 계획 수립(Planning) 및 BDI 아키텍처와 밀접하게 연관된다.
사회성 (Social Ability)에이전트 통신 언어(ACL)를 사용하여 다른 에이전트나 인간과 정보를 교환하고, 목표 달성을 위해 협상(Negotiation)하거나 협력(Cooperation)하는 능력.개별 에이전트의 능력 범위를 넘어서는 복잡한 문제를 집단적 상호작용을 통해 해결하게 하는 MAS의 핵심 동력이다.

이러한 특성들은 에이전트를 객체 지향 프로그래밍(OOP)의 객체와 명확히 구분 짓는다. 객체는 메소드 호출에 대해 수동적으로 반응하지만, 에이전트는 요청을 거부하거나 수정 제안을 할 수 있는 자율적인 판단 주체이다. 즉, 객체는 “무엇을 할 것인가“에 대한 제어권이 외부에 있지만, 에이전트는 “언제, 어떻게 행동할 것인가“를 스스로 결정한다.

2.2 시스템 패러다임 비교: 단일, 분산, 그리고 다중 에이전트

MAS의 독특한 위치를 이해하기 위해서는 유사한 시스템 아키텍처와의 비교 분석이 필수적이다. 특히 분산 시스템(Distributed Systems)과 MAS는 계산 자원의 분산이라는 측면에서 유사하나, 제어의 주체와 목표의 일치성 여부에서 근본적인 차이를 보인다.1

단일 에이전트 시스템(Single Agent System)과의 비교:

단일 에이전트 시스템은 중앙화된 의사결정 구조를 가지며, 환경에 대한 모든 정보를 독점적으로 처리한다. 이는 최적화 관점에서는 효율적일 수 있으나, 처리해야 할 데이터의 양이 기하급수적으로 증가하거나 실시간 대응이 필요한 복잡한 환경에서는 ’인지적 과부하’에 직면한다. 반면 MAS는 문제를 하위 문제로 분할하여 병렬 처리함으로써 계산 효율성을 높이고, 특정 에이전트의 실패가 전체 시스템의 정지로 이어지지 않게 한다.

분산 시스템(Distributed Systems)과의 비교:

전통적인 분산 시스템은 데이터와 연산이 여러 노드에 퍼져 있지만, 이들은 일반적으로 단일한 설계자에 의해 정의된 하나의 전역 목표(Global Goal)를 위해 작동한다. 즉, 각 노드는 전체 시스템의 부품으로서 기능하며 자율성이 제한적이다. 반면, MAS의 에이전트들은 각기 다른 이해관계와 목표(Self-interested)를 가질 수 있다. 이들은 때로는 협력하지만, 자원의 배분을 두고 경쟁하거나 협상해야 하는 상황에 놓이기도 한다. 따라서 MAS 설계에서는 ’동기화’나 ’데이터 일관성’뿐만 아니라 ’게임 이론적 균형’이나 ’사회적 규범’과 같은 개념이 중요하게 다루어진다.

필립 슈미드(Philipp Schmid)의 분석에 따르면, 시스템 설계 시 ‘읽기 중심(Read Heavy)’ 작업과 ‘쓰기 중심(Write Heavy)’ 작업을 구분하는 것이 중요하다. 연구나 데이터 수집과 같은 읽기 중심 작업은 병렬 처리가 용이하므로 MAS가 적합하지만, 코딩이나 일관된 상태 유지가 필요한 쓰기 중심 작업은 컨텍스트 충돌 방지를 위해 단일 에이전트 혹은 매우 긴밀하게 조정된 구조가 더 유리할 수 있다.12

3. 에이전트 아키텍처: 인지에서 행동으로

에이전트가 외부 세계를 어떻게 내부적으로 모델링하고, 감각 입력을 행동으로 변환하는지를 결정하는 내부 구조, 즉 아키텍처는 MAS의 성능을 결정짓는 가장 중요한 요소 중 하나이다. 연구 문헌들은 이를 크게 반응형, 심의형, 그리고 하이브리드 아키텍처로 분류한다.13

3.1 반응형 아키텍처 (Reactive Architectures)

반응형 에이전트는 “지능은 복잡한 추론이 아니라 환경과의 상호작용에서 창발된다“는 철학에 기반한다. 이들은 환경에 대한 명시적인 내부 모델이나 심볼릭 표현(Symbolic Representation)을 갖지 않으며, 현재의 감각 입력에 대해 사전에 정의된 규칙(Rule)이나 행동 패턴을 즉각적으로 실행한다.13

로드니 브룩스(Rodney Brooks)의 **포섭 구조(Subsumption Architecture)**가 대표적인 예이다. 이 구조는 “장애물 피하기”, “배회하기”, “탐험하기“와 같은 단순한 행동 계층들이 수직적으로 쌓여 있으며, 상위 계층의 행동이 하위 계층을 억제(Inhibit)하거나 포섭(Subsume)함으로써 복잡한 행동을 만들어낸다. 반응형 아키텍처는 계산 비용이 매우 낮고 실시간 반응성이 뛰어나다는 장점이 있지만, 장기적인 계획을 수립하거나 과거의 경험을 학습하여 행동을 수정하는 데에는 한계가 있다.

3.2 심의형 아키텍처와 BDI 모델 (Deliberative Architectures & BDI)

심의형 에이전트는 고전적 AI의 상징주의(Symbolism) 전통을 따른다. 이들은 환경에 대한 명시적인 세계 모델(World Model)을 유지하며, 논리적 추론을 통해 행동을 계획한다. 가장 널리 채택되고 연구된 모델은 BDI(Belief-Desire-Intention) 아키텍처이다.13

  • 믿음(Beliefs): 에이전트가 현재 인지하고 있는 환경의 상태 정보이다. 이는 단순한 데이터베이스가 아니라 에이전트가 ’참’이라고 믿는 명제들의 집합으로, 불확실하거나 부정확할 수도 있다.
  • 욕구(Desires): 에이전트가 달성하고자 하는 목표나 상태들의 집합이다. 욕구들은 서로 상충될 수 있으며(예: “빨리 가고 싶다” vs “안전하게 가고 싶다”), 실현 가능성이 고려되지 않은 상태일 수 있다.
  • 의도(Intentions): 상충하는 욕구들 중에서 현재 시점에 달성하기로 선택(Commit)하고, 구체적인 실행 계획을 수립한 목표이다. 의도는 에이전트의 행동을 지속시키는 동력이 되며, 환경이 급격히 변하지 않는 한 유지된다.

BDI 모델은 인간의 실천적 추론(Practical Reasoning) 과정을 모방하였기에 설계자가 직관적으로 이해하기 쉽고, 복잡한 문제 해결을 위한 계획 수립에 강력하다. 그러나 매 순간 논리적 추론을 수행해야 하므로 계산 복잡도가 높고, 급변하는 환경에 대한 반응 속도가 느릴 수 있다는 단점이 있다.

3.3 하이브리드 아키텍처 (Hybrid Architectures)

현실의 복잡한 문제들은 빠른 반응성과 깊이 있는 심의 능력을 동시에 요구한다. 하이브리드 아키텍처는 반응형 시스템의 신속성과 심의형 시스템의 계획 능력을 결합하여 이러한 요구를 충족시킨다.14

일반적으로 하이브리드 아키텍처는 수직적 또는 수평적 계층 구조(Layered Architecture)를 띤다. 예를 들어, TouringMachinesInteRRaP과 같은 아키텍처는 다음과 같은 계층을 갖는다:

  1. 반응 계층(Reactive Layer): 센서 입력을 받아 즉각적인 위험 회피나 반사적 행동을 수행한다.
  2. 계획 계층(Planning/Deliberative Layer): 장기적인 목표를 달성하기 위한 경로를 생성하고 자원을 할당한다.
  3. 협력 계층(Cooperation/Social Layer): 다른 에이전트와의 통신 및 협상을 담당한다.

이러한 구조는 에이전트가 예기치 않은 장애물은 즉시 피하면서도(반응형), 목적지를 향한 최적 경로를 유지하고(심의형), 필요시 다른 에이전트에게 길을 비켜달라고 요청(사회형)할 수 있게 한다.

4. 에이전트 통신 및 의미론적 상호운용성

MAS의 진정한 힘은 개별 에이전트의 능력이 아니라 그들의 상호작용에서 나온다. 이를 위해서는 에이전트들이 정보를 교환하고 의도를 전달할 수 있는 정교한 통신 체계가 필요하다.

4.1 에이전트 통신 언어(ACL): KQML과 FIPA-ACL

단순한 데이터 전송을 넘어, 화자(Speaker)의 의도와 태도를 전달하기 위해 **에이전트 통신 언어(ACL)**가 개발되었다. ACL은 존 서얼(John Searle) 등의 화행 이론(Speech Act Theory)에 이론적 기반을 두고 있다. 화행 이론에 따르면 언어는 단순히 정보를 기술하는 것이 아니라, “약속하다”, “요청하다”, “선언하다“와 같이 세상의 상태를 변화시키는 행위(Act)이다.18

  • KQML(Knowledge Query and Manipulation Language): 1990년대 초반 미국 DARPA의 지식 공유 노력(KSE)의 일환으로 제안되었다. 메시지는 내용을 담는 ‘콘텐츠 계층’, 메시지의 유형(질의, 응답 등)을 정의하는 ‘수행적(Performative) 계층’, 그리고 전송 정보를 담는 ’통신 계층’으로 구성된다.20
  • FIPA-ACL: FIPA(Foundation for Intelligent Physical Agents) 단체에 의해 표준화된 언어로, KQML을 계승하면서도 의미론(Semantics)을 더욱 엄밀하게 정의하였다.20 FIPA-ACL은 20개 이상의 수행적 동사(Performatives)를 정의하고 있는데, 대표적으로 INFORM(수신자가 어떤 사실을 믿게 하려는 의도), REQUEST(수신자가 어떤 행동을 하게 하려는 의도), CFP(Call for Proposal, 입찰 요청) 등이 있다.

4.2 온톨로지(Ontology)와 지식 공유

에이전트들이 ACL을 통해 메시지를 주고받더라도, 메시지 내용(Content)에 포함된 용어의 의미를 서로 다르게 해석한다면 협력은 불가능하다. 예를 들어, 한 에이전트는 ’Apple’을 과일로, 다른 에이전트는 IT 기업으로 이해할 수 있다.

이러한 의미론적 상호운용성(Semantic Interoperability) 문제를 해결하기 위해 MAS는 온톨로지를 활용한다. 온톨로지는 특정 도메인의 개념(Concept)과 그들 간의 관계(Relation)를 명시적으로 정의한 명세서이다.19 에이전트들은 공통의 온톨로지를 참조함으로써 메시지 내용의 의미를 정확하게 파악하고 추론할 수 있다. 이는 시맨틱 웹(Semantic Web) 기술과 밀접하게 연관되어 있으며, 최근에는 지식 그래프(Knowledge Graph) 형태로 에이전트의 지식 베이스를 구축하는 추세이다.

5. 조직 구조와 사회적 조정

수많은 에이전트가 존재하는 대규모 시스템에서는 효율적인 관리를 위해 인간 사회의 조직 구조를 모방한 형태가 도입된다. 조직 구조는 에이전트 간의 통신 경로와 권한 관계를 규정하여 상호작용의 복잡성을 줄인다.23

5.1 계층 구조와 홀라키 (Hierarchies & Holarchies)

계층 구조는 전통적인 트리 형태의 조직으로, 상위 에이전트가 하위 에이전트에게 명령을 내리고 정보를 취합한다. 이는 통신 오버헤드를 줄이고 일관된 제어를 가능하게 하지만, 상위 노드에 부하가 집중되고 유연성이 떨어진다는 단점이 있다.

이를 보완하기 위해 홀라키(Holarchy) 구조가 제안되었다. 아서 쾨슬러(Arthur Koestler)의 개념에서 유래한 홀라키는 ’홀론(Holon)’들로 구성된다. 홀론은 그 자체로 자율적인 전체이면서 동시에 상위 시스템의 부분으로 기능한다. 예를 들어, 스마트 팩토리에서 개별 로봇(홀론)은 자율적으로 작업을 수행하면서도 제조 라인(상위 홀론)의 통제를 받는다. 이는 시스템에 자기 유사성(Self-similarity)과 유연성을 부여한다.26

5.2 연합과 팀 (Coalitions & Teams)

**연합(Coalition)**은 특정 목표를 달성하기 위해 에이전트들이 일시적으로 형성하는 협력체이다. 연합 형성(Coalition Formation)은 어떤 에이전트들이 뭉쳐야 가장 높은 효용을 낼 수 있는지, 그리고 얻어진 이득을 어떻게 공정하게 분배할 것인지(배당 문제)를 결정해야 하는 복잡한 문제이다.26 반면, **팀(Team)**은 공동의 장기적 목표를 공유하며 구성원 간의 역할이 명확히 정의된 보다 지속적인 구조를 의미한다.

6. 조정, 협상 및 게임 이론적 접근

자율적인 에이전트들이 충돌 없이 자원을 공유하거나 작업을 배분하기 위해서는 정교한 조정(Coordination) 및 협상(Negotiation) 프로토콜이 필수적이다.

6.1 계약망 프로토콜 (Contract Net Protocol, CNP)

CNP는 작업을 할당하기 위한 가장 고전적이고 직관적인 시장 기반 프로토콜이다. 이는 매니저(발주자)와 컨트랙터(수주자) 간의 입찰 과정을 모델링한다.27

  1. 작업 공고(Task Announcement): 매니저가 작업의 요건을 네트워크에 브로드캐스트한다.
  2. 입찰(Bidding): 수행 가능한 에이전트들이 자신의 비용과 능력을 바탕으로 입찰서를 제출한다.
  3. 낙찰(Contract Awarding): 매니저가 입찰서를 평가하여 최적의 에이전트를 선정한다.
  4. 계약 이행(Contract Execution): 선정된 에이전트가 작업을 수행하고 결과를 보고한다.

CNP는 중앙 집중식 할당보다 유연하며, 최근 연구에서는 기계학습을 결합하여 데이터 시장에서의 거래 효율성을 높이거나(CNP-MLDM), 스마트 그리드의 전력 할당을 최적화하는 데 활용되고 있다.30

6.2 경매 메커니즘과 비크리 경매

희소한 자원을 할당하기 위해 다양한 경매 방식이 사용된다. 특히 비크리 경매(Vickrey Auction) 또는 제2가격 밀봉 입찰(Second-price sealed-bid auction)은 MAS에서 중요한 의미를 갖는다. 이 방식에서 낙찰자는 가장 높은 가격을 써낸 사람이 되지만, 지불하는 금액은 두 번째로 높은 입찰가로 결정된다.

이 메커니즘의 핵심은 진실성(Truthfulness) 또는 유인 양립성(Incentive Compatibility)에 있다. 입찰자가 자신의 실제 가치보다 낮게 입찰하거나 높게 입찰하는 것이 전략적으로 이득이 되지 않으므로, 에이전트들이 자신의 진실된 가치(True Valuation)를 드러내도록 유도한다.32 이는 에이전트가 서로의 전략을 추측하는 복잡한 계산(Counterspeculation)을 줄여주어 시스템 전체의 효율성을 높인다.

6.3 게임 이론과 내쉬 균형

에이전트들이 서로 경쟁하는 상황에서 최적의 전략을 분석하기 위해 게임 이론(Game Theory)이 적용된다. **내쉬 균형(Nash Equilibrium)**은 모든 에이전트가 현재의 전략을 고수할 때, 어떤 에이전트도 혼자서 전략을 바꾸어서는 이득을 볼 수 없는 상태를 의미한다.35

MAS 설계자들은 시스템이 바람직한 내쉬 균형에 도달하도록 유틸리티 함수를 설계하거나, ’죄수의 딜레마’와 같은 상황에서 협력을 유도하기 위한 보상 체계를 구축해야 한다. 또한, 분산된 의사결정이 중앙 집중식 최적해에 비해 얼마나 효율성이 떨어지는지를 측정하는 무질서의 비용(Price of Anarchy) 개념도 중요하게 다루어진다.

7. 다중 에이전트 강화학습 (Multi-Agent Reinforcement Learning, MARL)

전통적인 MAS가 사전에 정의된 규칙에 의존했다면, MARL은 에이전트들이 시행착오를 통해 최적의 정책을 스스로 학습하게 한다. 그러나 단일 에이전트 강화학습을 MAS에 그대로 적용하면 비정상성(Non-stationarity) 문제에 직면한다. 한 에이전트가 학습하여 정책을 바꾸면, 다른 에이전트 입장에서는 환경의 역학이 변하는 것과 같아지기 때문에 수렴이 어려워진다.

7.1 CTDE (Centralized Training Decentralized Execution)

이 문제를 해결하기 위한 지배적인 패러다임이 바로 CTDE이다. 학습 단계(Training)에서는 중앙의 크리틱(Critic)이 모든 에이전트의 상태와 행동 정보를 활용하여 전역적인 피드백을 제공한다. 그러나 실제 실행 단계(Execution)에서는 각 에이전트가 자신의 로컬 관측(Local Observation)만을 바탕으로 행동하는 정책 네트워크(Actor)를 사용한다.37 이는 학습의 안정성과 실행의 분산성을 동시에 달성한다.

7.2 주요 알고리즘: QMIX와 MAPPO

알고리즘기반 방법론핵심 메커니즘 및 특징
QMIX가치 기반 (Value-based)개별 에이전트의 Q값(Q_a)을 믹싱 네트워크(Mixing Network)를 통해 결합하여 전역 Q값(Q_{tot})을 추정한다. 핵심은 **단조성 제약(Monotonicity Constraint)**으로, 믹싱 네트워크의 가중치를 양수로 제한하여 전역 Q값의 최대화가 개별 Q값의 최대화와 일치하도록 보장한다. 이를 통해 분산 실행이 가능해진다.39
MAPPO정책 기반 (Policy-based)PPO(Proximal Policy Optimization) 알고리즘을 다중 에이전트 환경으로 확장한 것이다. 중앙 집중형 가치 함수를 사용하여 협력을 유도한다. 연구 결과에 따르면, 스타크래프트(SMAC)와 같은 복잡한 환경에서 MAPPO가 QMIX와 같은 오프 폴리시 알고리즘보다 더 우수한 성능과 샘플 효율성을 보이는 경우가 많다.37

8. LLM 기반 다중 에이전트: 생성형 에이전트의 등장

대규모 언어 모델(LLM)의 등장은 MAS 연구의 지평을 완전히 바꾸어 놓았다. LLM은 에이전트에게 인간 수준의 자연어 이해 능력, 상식적 추론 능력, 그리고 복잡한 계획 수립 능력을 부여했다.

8.1 생성형 에이전트와 사회적 시뮬라크라

스탠포드와 구글의 “Generative Agents” 연구는 LLM 에이전트들이 가상 마을 ’스몰빌(Smallville)’에서 인간처럼 생활하는 모습을 보여주었다. 이 시스템의 핵심은 기억 스트림(Memory Stream), 반추(Reflection), **계획(Planning)**의 구조이다.44

에이전트는 모든 경험을 자연어로 기록하고(기억), 중요도에 따라 기억을 검색하여 상위 수준의 통찰을 형성하며(반추), 이를 바탕으로 하루 일과를 계획한다. 예를 들어, 한 에이전트가 “발렌타인 파티를 열고 싶다“는 생각을 하면, 이는 다른 에이전트들에게 초대장을 보내고 데이트를 신청하는 일련의 사회적 상호작용으로 자연스럽게 이어진다. 이는 MAS가 사회과학적 가설을 검증하는 강력한 시뮬레이션 도구가 될 수 있음을 시사한다.

8.2 협업 프레임워크: AutoGen과 MetaGPT

소프트웨어 개발이나 데이터 분석과 같은 복잡한 작업을 수행하기 위해 LLM 에이전트들을 조직화하는 프레임워크들이 개발되었다.

  • AutoGen (Microsoft): ‘대화 가능한(Conversable)’ 에이전트 개념을 도입했다. 개발자는 코딩 에이전트, 사용자 대리 에이전트 등 다양한 역할을 정의하고, 이들 간의 대화 흐름을 설계할 수 있다. 그룹 채팅, 계층적 채팅, 중첩 채팅 등 유연한 대화 패턴을 지원하여 복잡한 워크플로우를 구현한다.47
  • MetaGPT: “Code = SOP(Team)“이라는 철학을 바탕으로, 에이전트의 상호작용에 **표준 운영 절차(SOP)**를 강제한다. 제품 매니저가 요구사항을 작성하면 아키텍트가 설계를 하고 엔지니어가 코드를 짜는 식의 소프트웨어 회사 구조를 모방한다. 자유로운 대화 대신 구조화된 문서(PRD, API 명세서 등)를 주고받게 함으로써 LLM의 고질적인 문제인 환각(Hallucination)을 줄이고 결과물의 일관성을 높인다.4

9. 강건성, 보안, 그리고 신뢰 관리

MAS가 폐쇄된 실험실을 벗어나 개방형 인터넷 환경이나 중요 인프라에 적용됨에 따라, 시스템의 안전성과 신뢰성을 보장하는 것이 핵심 과제가 되었다.

9.1 결함 감수성(Fault Tolerance)과 교착 상태 해결

분산 시스템인 MAS는 일부 에이전트의 고장에도 전체 기능이 유지되어야 한다. 이를 위해 에이전트 복제(Replication), 상태 체크포인팅(Checkpointing), 하트비트 모니터링 등의 기술이 사용된다.52 또한 자원 경쟁으로 인한 **교착 상태(Deadlock)**를 방지하기 위해 대기 그래프(Wait-for Graph)를 이용한 순환 탐지, 타임아웃, 협상 토큰, 우선순위 기반 선점 등의 기법이 적용된다.54

9.2 신뢰 및 평판 모델 (Trust & Reputation)

개방형 MAS에서는 악의적인 에이전트가 진입하여 시스템을 교란하거나 무임승차(Free-riding)할 위험이 있다. 이를 관리하기 위해 평판 시스템이 도입된다.

  • 베타 평판 시스템(Beta Reputation System): 에이전트의 과거 행동(만족/불만족)을 통계적 베타 분포로 모델링하여 미래의 행동 확률을 예측한다.56
  • 주관적 논리(Subjective Logic): 신뢰를 단순히 하나의 확률값이 아닌 ‘믿음(Belief)’, ‘불신(Disbelief)’, ’불확실성(Uncertainty)’의 3차원으로 표현한다. 이는 정보가 부족한 상황에서의 불확실성을 명시적으로 다룰 수 있어, 에이전트가 낯선 상대를 만났을 때의 위험을 더 정교하게 평가할 수 있게 한다.57

10. 산업 응용 사례: 이론의 실현

10.1 스마트 그리드와 PowerMatcher

신재생 에너지의 확산으로 전력망의 변동성이 커지면서, 이를 제어하기 위한 MAS 기술이 필수적이 되었다. 네덜란드의 PowerMatcher 프로젝트는 에이전트 기반의 실시간 전력 시장을 구현했다. 각 가정의 기기(히트펌프, 전기차 등)를 대변하는 에이전트들은 자신의 전력 필요량에 따른 입찰 곡선(Bid Curve)을 제출하고, 상위 집계 에이전트가 균형 가격을 산출한다. 이를 통해 중앙의 강제적인 제어 없이도 피크 부하를 30~50% 감소시키는 성과를 거두었다.59

10.2 스웜 로보틱스와 물류 혁신 (Ocado)

영국의 온라인 식료품 기업 Ocado는 MAS 기술을 물류 창고에 적용하여 혁신을 이뤘다. 수천 대의 로봇이 거대한 격자형 그리드 위를 초속 4m로 이동하며 식료품을 피킹한다. 이들은 4G 기반의 저지연 통신을 통해 서로의 위치와 경로를 실시간으로 공유하고 조정함으로써 충돌을 방지하고 최적의 경로를 찾아낸다. 이는 개미 군집 최적화(ACO)와 같은 자연 모방 알고리즘이 실제 산업 현장에서 거대한 규모로 구현된 대표적인 사례이다.62

10.3 공급망 관리 (SCM)

MAS는 복잡하고 불확실한 공급망을 유연하게 관리하는 데 활용된다. 각 공급망 단계의 에이전트들은 로컬 정보를 바탕으로 재고 수준을 모니터링하고, 수요 급증이나 공급 차질과 같은 이벤트 발생 시 상호 협상을 통해 물량을 조절한다. 이는 채찍 효과(Bullwhip Effect)를 완화하고 공급망 전체의 회복탄력성(Resilience)을 높이는 데 기여한다.65

11. 결론 및 향후 전망

다중 에이전트 시스템(MAS)은 개별 지능의 합보다 더 큰 집단 지성을 창출하는 기술적 프레임워크로 진화해 왔다. 자율성, 반응성, 능동성, 사회성이라는 에이전트의 특성은 경직된 중앙 집중형 시스템의 한계를 극복하고, 유연하고 확장 가능한 분산 해결책을 제시한다.

초기의 BDI 아키텍처와 계약망 프로토콜에서 시작된 MAS 연구는 강화학습(MARL)을 통해 학습 능력을 갖추게 되었고, 최근에는 대규모 언어 모델(LLM)과 결합하여 인간 수준의 추론과 사회적 상호작용이 가능한 ‘생성형 에이전트’ 시대로 진입하고 있다. MetaGPT와 AutoGen 같은 프레임워크는 이러한 기술이 소프트웨어 개발, 데이터 분석 등 지식 노동의 자동화에 즉각적으로 적용될 수 있음을 보여준다.

향후 MAS 기술은 에이전트 간의 의미론적 상호운용성을 고도화하고, 개방형 환경에서의 보안과 신뢰 문제를 해결하며, 인간과 에이전트가 한 팀으로 협력하는 인간-에이전트 티밍(Human-Agent Teaming) 기술을 발전시키는 방향으로 나아갈 것이다. 스마트 그리드와 자율 물류 시스템에서의 성공은 MAS가 단순한 이론적 모델을 넘어 미래 사회의 핵심 인프라를 운영하는 운영체제(OS)가 될 것임을 강력하게 시사한다.

12. 참고 자료

  1. Single-agent and multi-agent architectures - Dynamics 365 - Microsoft Learn, https://learn.microsoft.com/en-us/dynamics365/guidance/resources/contact-center-multi-agent-architecture-design
  2. What is a multi-agent system in AI? | Google Cloud, https://cloud.google.com/discover/what-is-a-multi-agent-system
  3. Towards autonomous normative multi-agent systems for Human-AI software engineering teams - arXiv, https://arxiv.org/html/2512.02329v1
  4. What is MetaGPT ? | IBM, https://www.ibm.com/think/topics/metagpt
  5. What are the core characteristics of an intelligent agent? - Tencent Cloud, https://www.tencentcloud.com/techpedia/126353
  6. Multi-Agent Systems Fundamentals - A Personal Experience - Catio.tech, https://www.catio.tech/blog/multi-agent-systems-fundamentals—a-personal-experience
  7. The Rise of Multi-Agent Systems: What They Are and Why They Matter - DEV Community, https://dev.to/excellus/the-rise-of-multi-agent-systems-what-they-are-and-why-they-matter-e6i
  8. Intelligent Agents and Multi-Agent Systems: Transforming Collaborative AI - SmythOS, https://smythos.com/developers/agent-development/intelligent-agents-and-multi-agent-systems/
  9. What is a Multi-Agent System? | IBM, https://www.ibm.com/think/topics/multiagent-system
  10. Understanding AI Agents: Single-Agent vs Multi-Agent Systems, https://osamadev.medium.com/understanding-ai-agents-single-agent-vs-multi-agent-systems-dcd266e9a5f7?source=rss——ai-5
  11. Multi-agent Systems vs. Distributed Systems: Key Differences and Applications - SmythOS, https://smythos.com/developers/agent-development/multi-agent-systems-vs-distributed-systems/
  12. Multi-agent vs. single-agent: Which should you use?, https://www.youtube.com/shorts/7EhiJL_6ats
  13. Multi-Agent Systems: Concept, Applications, and Future — Blog Article - Aimwork, https://www.aimw.ai/blog/multi-agent-ai-system
  14. Multi Agent Systems | Architecture, Models & Applications - Dextra Labs, https://dextralabs.com/blog/multi-agent-systems/
  15. AI Agent Architectures: Modular, Multi-Agent, and Evolving - ProjectPro, https://www.projectpro.io/article/ai-agent-architectures/1135
  16. Types of Agent Architectures: A Guide to Reactive, Deliberative, and Hybrid Models in AI, https://smythos.com/developers/agent-development/types-of-agent-architectures/
  17. Agentic AI #4 — Understanding the Different Types of AI Agents: Reactive, Planning, and More | by Aman Raghuvanshi | Medium, https://medium.com/@iamanraghuvanshi/agentic-ai-4-understanding-the-different-types-of-ai-agents-reactive-planning-and-more-c7783cec7c69
  18. Agent Communication Protocols Explained - DigitalOcean, https://www.digitalocean.com/community/tutorials/agent-communication-protocols-explained
  19. Comparing Agent Communication Languages - OBJS, http://www.objs.com/agility/tech-reports/9807-comparing-ACLs.html
  20. Agent Communications Language - Wikipedia, https://en.wikipedia.org/wiki/Agent_Communications_Language
  21. agent communication languages comparison: fipa-acl and kqml, https://e-university.tu-sofia.bg/e-publ/files/2279_COMPUTER_SCIENCE2015_submission_7.pdf
  22. Comparing Agent Communication Languages and Protocols: Choosing the Right Framework for Multi-Agent Systems - SmythOS, https://smythos.com/developers/agent-development/agent-communication-languages-and-protocols-comparison/
  23. A Taxonomy of Hierarchical Multi-Agent Systems: Design Patterns, Coordination Mechanisms, and Industrial Applications - arXiv, https://arxiv.org/html/2508.12683v1
  24. (PDF) A Survey of Multi-agent Organizational Paradigms - ResearchGate, https://www.researchgate.net/publication/231964559_A_Survey_of_Multi-agent_Organizational_Paradigms
  25. Organizing Multi-Agent Systems, http://cse.unl.edu/~lksoh/Classes/CSCE475_875_Fall13/SeminarNashtags.pdf
  26. A SURVEY OF MULTI-AGENT ORGANIZATIONAL PARADIGMS, http://cse.unl.edu/~lksoh/Classes/CSCE990AMAS_Spring13/Seminar04.pdf
  27. Contract net protocol – Knowledge and References - Taylor & Francis, https://taylorandfrancis.com/knowledge/Engineering_and_technology/Artificial_intelligence/Contract_net_protocol/
  28. The Contract Net Protocol: High-Level Communication and Control in a Distributed Problem Solver - Reid G. Smith, https://www.reidgsmith.com/The_Contract_Net_Protocol_Dec-1980.pdf
  29. What is Contract Net Interaction Protocol?, http://www2.ensc.sfu.ca/research/iDEA/courses/files/Contract%20Net%20Protocol1.pdf
  30. CNP-MLDM: Contract Net Protocol for Negotiation in Machine Learning Data Market - CEUR-WS.org, https://ceur-ws.org/Vol-3928/paper_173.pdf
  31. Task Assignment of the Improved Contract Net Protocol under a Multi-Agent System - MDPI, https://www.mdpi.com/1999-4893/12/4/70
  32. Vickrey–Clarke–Groves auction - Wikipedia, https://en.wikipedia.org/wiki/Vickrey%E2%80%93Clarke%E2%80%93Groves_auction
  33. Econ 805 – Advanced Micro Theory I Dan Quint Fall 2009 Lecture 16 Today - a fairly brief overview of multi-unit auctions. •, https://users.ssc.wisc.edu/~dquint/econ805%202009/lectures/econ%20805%20lecture%2016.pdf
  34. Issues in Computational Vickrey Auctions*, https://www.cs.cmu.edu/~sandholm/vickrey.IJEC.pdf
  35. Game Theory: A Modern Approach to Multiagent Coordination, https://ieeecss.org/presentation/conference-plenary-lecture/game-theory-modern-approach-multiagent-coordination
  36. Multiagent Systems: Intro to Game Theory, https://cs.uwaterloo.ca/~klarson/teaching/F17-486/notes/15GT.pdf
  37. Multi-Agent Reinforcement Learning (PPO) with TorchRL Tutorial - PyTorch, https://docs.pytorch.org/rl/main/tutorials/multiagent_ppo.html
  38. Benchmarking Multi-Agent Deep Reinforcement Learning Algorithms in Cooperative Tasks, https://datasets-benchmarks-proceedings.neurips.cc/paper/2021/file/a8baa56554f96369ab93e4f3bb068c22-Paper-round1.pdf
  39. Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning, https://jmlr.org/papers/volume21/20-081/20-081.pdf
  40. Weighted QMIX: Expanding Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning - University of Oxford Department of Computer Science, http://www.cs.ox.ac.uk/people/shimon.whiteson/pubs/rashidnips20.pdf
  41. Soft-QMIX: Integrating Maximum Entropy For Monotonic Value Function Factorization - arXiv, https://arxiv.org/html/2406.13930v2
  42. A simple analysis of why IPPO performs better than MAPPO in MARL - Reddit, https://www.reddit.com/r/reinforcementlearning/comments/16dtc19/a_simple_analysis_of_why_ippo_performs_better/
  43. The Surprising Effectiveness of PPO in Cooperative, Multi-Agent Games - arXiv, https://arxiv.org/pdf/2103.01955
  44. [2411.10109] Generative Agent Simulations of 1,000 People - arXiv, https://arxiv.org/abs/2411.10109
  45. Generative Agents: Interactive Simulacra of Human Behavior - arXiv, https://arxiv.org/pdf/2304.03442
  46. Moore Is Different: “Generative Agents: Interactive Simulacra of Human Behavior”, https://scanalyst.fourmilab.ch/t/moore-is-different-generative-agents-interactive-simulacra-of-human-behavior/3039
  47. Exploring Multi-Agent Conversation Patterns with AutoGen Framework | by Senol Isci, PhD, https://medium.com/@senol.isci/exploring-multi-agent-conversation-patterns-with-the-autogen-framework-29946f199ca5
  48. Group Chat — AutoGen - Microsoft Open Source, https://microsoft.github.io/autogen/stable//user-guide/core-user-guide/design-patterns/group-chat.html
  49. AutoGen: Enabling Next-Gen LLM Applications via Multi-Agent Conversation - arXiv, https://arxiv.org/pdf/2308.08155
  50. FoundationAgents/MetaGPT: The Multi-Agent Framework: First AI Software Company, Towards Natural Language Programming - GitHub, https://github.com/FoundationAgents/MetaGPT
  51. MetaGPT: Meta Programming for a Multi-Agent Collaborative Framework - arXiv, https://arxiv.org/html/2308.00352v6
  52. How do multi-agent systems ensure fault tolerance? - Milvus, https://milvus.io/ai-quick-reference/how-do-multiagent-systems-ensure-fault-tolerance
  53. Fault Tolerance in Distributed Systems: Strategies and Case Studies - DEV Community, https://dev.to/nekto0n/fault-tolerance-in-distributed-systems-strategies-and-case-studies-29d2
  54. Agent-to-Agent Deadlock Resolution: Technical Solutions for Multi-Agent Systems : r/AI_associates - Reddit, https://www.reddit.com/r/AI_associates/comments/1npjr8h/agenttoagent_deadlock_resolution_technical/
  55. MONITORING MULTI-AGENT SYSTEMS FOR DEADLOCK DETECTION BASED ON UML MODELS, http://www.sce.carleton.ca/~nmani/papers/CCECE08_NM.pdf
  56. A reputation-oriented trust model for multi-agent environments - Emerald Publishing, https://www.emerald.com/imds/article/116/7/1380/174980/A-reputation-oriented-trust-model-for-multi-agent
  57. Subjective logic - Wikipedia, https://en.wikipedia.org/wiki/Subjective_logic
  58. Modelling second-order uncertainty in state machines - White Rose Research Online, https://eprints.whiterose.ac.uk/id/eprint/196630/14/Subjective_Logic_State_Machines.pdf
  59. PowerMatching City: Lighthouse project - DNV, https://www.dnv.com/cases/powermatching-city-lighthouse-project-79544/
  60. Intelligent energy management using powermatcher: Recent results from field deployments and simulation studies | Request PDF - ResearchGate, https://www.researchgate.net/publication/261525563_Intelligent_energy_management_using_powermatcher_Recent_results_from_field_deployments_and_simulation_studies
  61. Dynamic Pricing by Scalable Energy Management Systems - Field Experiences and Simulation Results using PowerMatcher, https://faculty.sites.iastate.edu/tesfatsi/archive/tesfatsi/DynamicPricingByScalableEMSPowerMatcher.KKok2012.pdf
  62. A Review of Swarm Robotics in a NutShell - MDPI, https://www.mdpi.com/2504-446X/7/4/269
  63. Inside A Warehouse Where Thousands Of Robots Pack Groceries - YouTube, https://www.youtube.com/watch?v=4DKrcpa8Z_E
  64. Ocado’s AI-powered robotic arms: levelling up efficiency in online grocery and logistics, https://www.ocadogroup.com/newsroom/stories/ocado-robotic-arms
  65. Multi-Agent Systems for Supply Chain: A Guide - Auxiliobits, https://www.auxiliobits.com/blog/multi-agent-systems-for-supply-chain-a-guide/
  66. Building Supply Chain Multi-Agent System with LangGraph and WeatherAPI, https://tuanatran.medium.com/supply-chain-orchestration-using-multi-agent-system-a6aed67cbd6a
  67. Transforming Supply Chain Optimization with C3 AI’s Multi-Hop Orchestration Agents, https://c3.ai/blog/transforming-supply-chain-optimization-with-c3-ais-multi-hop-orchestration-agents-part-4/