2.11.2 생성형(Generative) 모델における 무한한 출력 상태(State Space)와 정답의 스펙트럼 화

2.11.2 생성형(Generative) 모델における 무한한 출력 상태(State Space)와 정답의 스펙트럼 화

거대 언어 모델(LLM)을 필두로 한 생성형(Generative) AI는 근본적으로 자기 회귀적(Autoregressive) 토큰 생성 메커니즘을 따른다. 이는 이전에 생성된 토큰들의 시퀀스(Sequence)를 조건부 확률(Conditional Probability)의 입력으로 삼아 다음 토큰을 지속적으로 예측해 나가는 방식이다. 이 메커니즘은 시스템의 출력 상태 공간(Output State Space)을 폭발적으로 팽창시킨다.

앞선 절에서 논의한 예측형(Predictive) 모델의 출력 상태 공간이 \{ \text{True}, \text{False} \} 와 같이 극도로 제한된 차원을 갖는다면, 단어 사전(Vocabulary Size)이 V이고, 최대 생성 토큰 길이가 L인 생성형 AI의 이론적 상태 공간의 크기는 O(V^L)에 달한다. 이는 사실상 수치화가 무의미한 **무한한 출력 상태(Infinite State Space)**이다.

1. 무한한 상태 공간이 촉발하는 근본적 테스팅 딜레마

엔지니어링의 관점에서 무한한 출력 공간이 내포하는 의미는 치명적이다.

만약 테스트 엔지니어가 예측형 모델의 방식으로 “이 프롬프트의 정답 문자열은 X다.” 라고 하드코딩된 단일 텍스트 정답지(Single Textual Ground Truth)를 작성했다고 가정해 보자. 생성형 모델이 출력한 결과물 YX와 완벽하게 동일한 문자열(Exact Match)일 확률은 사실상 0에 수렴한다. Temperature, Top-p 값의 미세한 변화 혹은 추론 서버를 구성하는 GPU의 부동 소수점 오차(Floating-point Nondeterminism)만으로도 단어의 순서, 동의어의 선택, 조사의 형태가 끊임없이 요동치기 때문이다.

이러한 출력의 기하급수적 발산(Divergence) 현상은, 입력값에 대응하는 단 하나의 ’절대적 정답’이 존재한다는 전통적 소프트웨어 공학의 ‘결정론적 단일 진실(Deterministic Single Truth)’ 개념 자체를 파괴해 버린다.

2. 정답의 스펙트럼 화 (Spectrum of Correctness)

단일 정답이 소멸한 열린 세계(Open-World)에서는, 결과물의 가치가 참/거짓(True/False)의 이분법이 아닌 **‘정답의 스펙트럼(Spectrum of Correctness)’**상에 분산되어 나타나게 된다. 동일한 데이터베이스에서 사용자 정보를 조회해 달라는 목적을 가진 응답이라 할지라도, 생성 결과는 다음과 같은 다차원적 품질의 스펙트럼 위에 놓인다.

  1. 완벽한 부합 (Perfect Adherence): 요구된 사실(Fact)을 모두 포함하며, 지시된 포맷(예: JSON)을 완벽히 지키고, 기업이 요구하는 톤앤매너(Tone and Manner)까지 충족한 상태.
  2. 형식적 결함 (Formatting Defect): 사실 관계는 맞으나, 약속된 JSON 스키마를 이탈하거나 마크다운 코드 블록(Markdown Code block)을 누락하여 데이터 파이프라인에서 파싱(Parsing) 에러를 유발하는 상태.
  3. 문체적 일탈 (Stylistic Deviation): 데이터는 정확하지만, 프롬프트에서 금지한 비속어를 사용하거나 고객을 응대하기에 부적절하게 강압적인 톤을 띤 상태.
  4. 부분적 환각 (Partial Hallucination): 유려한 문장과 прави 형식으로 답변했으나, 기업의 내부 매뉴얼(Golden Fact)에 존재하지 않거나 상충되는 내용을 일부 섞어 낸 상태.
  5. 완전한 실패 (Catastrophic Failure): 무의미한 토큰의 반복 생성, 완전한 환각, 혹은 프롬프트 인젝션(Prompt Injection)에 공격당해 악의적 코드를 출력하는 상태.

3. 검증 패러다임의 전환: 비교(Comparison)에서 제약(Constraint)으로

위와 같이 정답이 스펙트럼화 된 환경에서, 기존처럼 1차원적인 문자열 유사도(String Similarity - 예를 들어 BLEU 로직이나 ROUGE 스코어)를 산출하는 것은 비즈니스 신뢰도에 아무런 보증을 제공하지 못한다. 텍스트가 99% 일치하더라도, 누락된 1%가 계약 금액의 자릿수 0 이라면 그 응답은 명백한 치명적 실패(Catastrophic Failure)이기 때문이다.

따라서 생성형 모델에서의 테스트 오라클은 정답과의 표면적 텍스트 ’비교(Comparison)’를 포기해야 한다. 대신, 시스템이 절대적으로 양보할 수 없는 **구조적, 논리적 제약 조건(Constraints)**들을 스펙트럼 상에 촘촘하게 배치하고, 생성된 결과물이 그 제약의 그물망을 이탈하지 않았는가를 다차원적으로 검사하는 단속적 필터(Discrete Filter)의 형태로 진화해야 한다. 무한의 텍스트 공간을 통제 불가능한 상태로 내버려 두되, 그것이 우리 시스템으로 편입되기 직전의 인터페이스 경계면에서 결정론적 제약을 강제하는 것, 이것이 예측 불가 모델을 다루는 확정적 검증 로직의 핵심이다.