8.4.6 주장-증거(Claim-Evidence) 매핑을 통한 논리적 비약 검사

생성 단계에서 타겟 트랜스포머(Transformer) 모델이 저지르는 환각(Hallucination)의 형태 중 가장 교묘하고 악랄한 형태는, 모델이 텍스트의 바이트 표면적으로는 명백한 거짓(Lie) 어휘를 쓰지 않았으나 사실들 간의 인과관계(Causality)를 자기 마음대로 조작하여 **논리적 비약(Logical Leap)**을 창작해 내는 경우다.

예를 들어, Vector DB가 검색해 온 사내 문서 A 문단에 *“이번 3분기 당사의 플랫폼 매출이 전년 대비 15% 떨어졌다”*라고 적혀 있고, 완전히 다른 맥락인 문서 B 문단에 *“당사는 지난 7월부터 새로운 전사적 자원 관리(ERP) 시스템을 전면 도입했다”*라고 적혀 있다고 치자. 이때 타겟 모델이 이를 신나게 요약하다가 어텐션 회로가 꼬여버린 결과, 인간 사용자에게 임의로 *“당사가 최근 새로운 ERP를 강제 도입했기 때문에 업무 효율성이 떨어져 3분기 매출이 15%나 하락했습니다”*라고 있지도 않은 인과관계를 무단으로 조립(Fabrication)해 내는 끔찍한 사태다.
이 응답은 구성된 문장의 개별 팩트(매출 하락, ERP 도입) 단어 토큰들이 원본 문서와 완벽히 일치하므로, 앞서 서술한 기본적인 N-gram 중복도 검증이나 단순 NLI 함의 검증(단문 단위) 방화벽마저도 정상(True)으로 속이고 무사통과할 통계적 확률이 비정상적으로 높다.

이러한 고차원적이고 악의적인 논리 왜곡을 잡아내기 위해, 지식 오라클은 문장 단위를 넘어서 문단 전체의 논리적 결속력을 검열하는 주장-증거(Claim-Evidence) 매핑 아키텍처를 파이프라인 최후방에 가동한다.

1. 개별 주장(Claim) 텐서의 추출 및 독립화 파싱

오라클 미들웨어는 타겟 LLM이 최종 렌더링한 응답 텍스트를, 단순 마침표 단위를 넘어서 접속사와 인과관계 키워드(때문에, 그러므로, 결과적으로, As a result, Because 등)를 트리거 포인트로 삼아 정규표현식 파싱(Parsing)한다. 이를 통해 모델이 단순히 사실을 나열한 것이 아니라 ‘새로운 의견을 내세운(Asserted)’ 것으로 추정되는 ‘주장(Claim)’ 노드들을 모조리 추출해 낸다.

추출된 Claim 명제: “새로운 ERP의 전면 도입 행위가 3분기 매출 15% 하락 사태의 핵심 원인이다.”

2. 증거 스크리닝(Evidence Scanning)과 논리적 지지(Semantic Support) 평가망

오라클 배심원 엔진은 이제 모델이 도출한 이 건방진 Claim 텐서를 수학적으로 검증 및 증명하기 위해, 검색 단계 첫머리에서 밀어 넣어주었던 원본 Context 텍스트 덩어리들을 법정의 ’증거(Evidence) 채택 스캐닝 과정’처럼 차갑게 하나씩 교차 대조(Cross-Reference)하기 시작한다.

오라클 알고리즘의 심문 로직: “원본 DB 문서의 바이트 스트림 안(Evidence)의 그 어떤 구석에라도, ’ERP 도입 이벤트’와 ’매출 하락’이라는 두 엔터티 사이에 명시적이고 직접적인 상관관계(Correlation) 엣지를 연결해 주는 문장이나 수치가 단 1px이라도 물리적으로 기록되어 존재하는가?”
분절성(Disjoint) 확인: 만약 저 두 개의 사실 지표가 원본 문서 상에서는 물리적/맥락적으로 완전히 멀리 떨어진 챕터에 속해 있거나 철저히 분리된 다른 문단에서 파생(Derive)되었다는 사실이 스캐닝 결과 밝혀진다면, 오라클 판사 미들웨어(주로 지시를 강하게 조인 파인튜닝 로컬 LLM-as-a-judge)는 타겟 LLM이 무단으로 연결한 이 텍스트 매핑 고리를 강제 에러로 규정하고 물리적으로 끊어버린다(Disconnect).

3. 비약(Leap) 확정과 엄격한 거부권 행사(Reject & Fallback)

원본의 텍스트 증거(Evidence) 공간에 의해 그 인과관계가 온전히 지지받지 못하는(Unsupported) 건방진 주장(Claim) 결속 구간이 단 한 곳이라도 발견되는 그 즉각적인 순간, 오라클 시스템은 이 전체 응답 트랜잭션을 매우 심각한 ‘추론적 환각(Inferential Hallucination)’ 보안 사고로 규정하고 배포를 거절(Reject) 처분한다.

결정론적 폐쇄망을 지향하는 엔터프라이즈 B2B 환경에서, 지식 기반 모델 시스템은 유저가 요청한 팩트 데이터를 정확하게 검색해서 ‘그대로 번역하여 보여주는’ 리트리버 대변인 역할에만 철저하게 충실해야 한다.
사내 문서에 전혀 명시되지도 않은 쓸데없는 ‘통찰력 있는 결론(Insightful Conclusion)’ 따위를 기계 모델 스스로 유추하여 도출하려 드는 뉴럴 네트워크의 파라미터적 오만함은 철저히 통제되고 징벌당해야만 시스템의 무결성이 유지된다. 이 Claim-Evidence 교차 매핑 파이프라인 아키텍처는, 결정론적 기업용 AI의 본질 철학이 “오만함을 버리고 오직 텍스트로 적혀 있는 것만 지껄이도록 모델을 기계적으로 통제하는 것“에 있음을 증명하는 가장 완고하고 차가운 논리적 방화벽(Logical Firewall)이다.