8.1.3 세계 지식(World Knowledge) 대 문맥 지식(Context Knowledge)의 구분

엔터프라이즈 환경에서 무결점 LLM 기반의 RAG 오라클 검증 시스템을 구축할 때 딥러닝 아키텍트가 마주하게 되는 가장 까다로운 철학적 딜레마이자 설계상의 알고리즘 난제는, 생성 모델이 최종적으로 출력해 낸 답변의 정보 재료(Ingredient)를 **‘세계 지식(World Knowledge)’**과 **‘문맥 지식(Context Knowledge)’**이라는 두 영역으로 칼같이 분리(Decoupling)해 내는 파싱 작업이다.

만약 오라클 엔진이 텐서 연산 과정에서 이 두 가지 지식의 경계를 명확하게 판별하지 못하고 뒤섞어 버린다면, 당신이 구축한 수십억 짜리 거대 RAG 시스템은 기업의 은닉 데이터를 대변하는 안전한 인트라넷 폐쇄망 봇이 아니라, 언제든 통제 불능의 헛소리를 지어부르는 구글 검색 엔진의 싸구려 열화판(Degraded version) 챗봇으로 전락하고 만다.

1. 딥러닝 지식 모델의 이원화(Dichotomy) 정의

세계 지식 (World Knowledge / Parametric Knowledge): 타겟 언어 모델이 최초의 자가 지도 학습(Pre-training) 과정에서 테라바이트 단위의 개방망 인터넷 코퍼스(Wikipedia, GitHub, Common Crawl 등)를 삼키며 파라미터(Weight) 내부에 부동소수점 형태로 압축해 구축해 둔 ’통계적 글로벌 상식’이다. “대한민국의 수도는 서울이다“라거나, “객체 지향 프로그래밍의 특징은 상속과 다형성이다“와 같은 인류의 보편적 상식 명제들이 여기에 무의식적으로 은닉되어 있다.
문맥 지식 (Context Knowledge / Non-parametric Knowledge): 모델의 가중치와는 전혀 무관하게, 외부의 사내 벡터 데이터베이스에서 실시간(Runtime)으로 검색되어 타겟 아키텍처의 [System Prompt]나 유저 컨텍스트 영역으로 강제 임베딩(Injection)된 한정된 텍스트 문서 조각이다. “2024년 2분기 보안팀의 결산 예산은 300만 원이다“와 같이 시공간적으로 극도로 제한된 기업의 비공개 팩트 데이터다.

2. RAG 오라클의 가혹하고 폐쇄적인 채점 철학

일방적인 B2C ChatGPT 챗봇이라면 모델이 막힌 질문에서 똑똑하게 ’세계 지식’을 끌어다 유창하게 쓰는 것을 창의적이라고 칭찬하며 고득점을 부여할 것이다. 그러나 엔터프라이즈 RAG 오라클의 가혹한 평가 루브릭은 이를 명백한 ’데이터 탈취 및 규정 위반(Policy Violation)’이라는 심각한 치명적 결함으로 단죄한다.

오라클 시스템의 메타-평가(Meta-Evaluation) 원칙은 매우 가혹하다. 타겟 모델이 제출한 정답 스트링에 포함된 모든 독립 명제(Independent Claim)는 예외 없이 100% ’문맥 지식(주입된 문서)’으로 역방향 매핑(Reverse Mapping & Grounding)될 수 있어야만 한다.

치명적 오답의 예시: 만약 유저가 사내 챗봇에게 “우리 회사 클라우드 보안 정책 위반 시 페널티가 뭐야?“라고 질의했고, RAG 엔진이 가져다준 사내 ‘문맥 지식’ 문서 스니펫에는 오직 ’접근 권한 1주일 정지 조치’만 적혀 있는데, 타겟 능동 모델이 무의식적으로 자신의 일반 상식(세계 지식) 가중치를 발현하여 “접근이 정지되며, 또한 정보통신망법에 의거하여 최대 1천만 원의 벌금이 부과될 수 있습니다“라고 덧붙여 대답했다면 어떻게 될까?

비록 대한민국의 실제 법률(세계 지식)에 비추어 저 답변이 법적으로 소름 돋게 정확한 100점짜리 무결점 팩트라 할지라도, RAG 오라클 판사는 이를 추호의 망설임 없이 **“출처가 불분명한 외부 지식(세계 지식)의 무단 주입을 통한 시스템 데이터 오염 및 근거 없는 확장 응답(Ungrounded Extrapolation)”**으로 간주하여 해당 파이프라인 패치를 즉각 0점 처리(Fail)하고 프로덕션 배포를 차단한다.

3. 오라클 평가를 위한 프롬프트 엔지니어링 바운더리 강제 설정

가장 무서운 상황은 심판을 보는 LLM 오라클 본인조차도 타겟 문장을 검증하는 도중에 스스로의 세계 지식과 문맥 지식을 혼동하여 타겟 모델에게 관대한 합격점을 줘버리는 대참사(Judge Hallucination & Generative Confirmation Bias)다.

이를 원천적으로 아키텍처 레벨에서 차단하기 위해, 시스템 테스트 백엔드는 채점을 수행하는 심판관 모델의 뇌 구조에 다음과 같은 극도의 폐쇄성(Closed-domain Constraint)을 강제하는 하드코어 메타 프롬프트를 부여해야 한다.

“System: 당신은 극도로 까다롭고 모든 데이터를 의심하는 폐쇄적 지식 검열관(Zero-trust Validator)입니다. 타겟 엔진이 출력한 문서 응답을 교차 평가할 때, 당신 자신이 파운데이션 모델로서 사전 학습으로 터득해 알고 있는 모든 외부의 일반적인 상식, 물리 법칙, 역사적 팩트(세계 지식)를 뇌 속에서 완전히 백지화(Complete Amnesia) 시키십시오. 오직 당신 시스템에게 아래에 JSON으로 제공된 <Context> 태그 내부의 텍스트 문자열들만이 이 우주 상의 유일하고 완벽한 진리입니다. \n\n만약 타겟 문장이 현실 세계의 물리 법칙이나 국가 법률에 완벽히 부합하여 100% 맞는 말을 하더라도, <Context> 태그 트리에 그 단어 조합과 논리가 명시적(Explicitly)으로 적혀 있지 않다면 즉각 주저 없이 ‘Unfaithful(충실하지 않음)’ 에러 코드를 반환해야 합니다.”

이처럼 현대 오라클 아키텍처는 모델 파라미터 시냅스에 깊게 각인된 지능적이고 오만한 ’세계 지식’의 족쇄를 완전히 끊어버리고, 모델의 인식 체계를 강제로 좁디좁은 ’문맥 지식’의 감옥 텍스트 파일(Context File) 안에 가두어 잔인하게 채점시킴으로써, 기업 비공개 내부망 RAG 시스템의 신뢰도와 데이터 무결성 지표를 극한까지 방어해 낸다.