4.4.4 도메인 특화 용어 사전(Glossary) 및 금지어 블랙리스트(Blacklist) 시스템 프롬프트(System Prompt) 하드 주입 전략

4.4.4 도메인 특화 용어 사전(Glossary) 및 금지어 블랙리스트(Blacklist) 시스템 프롬프트(System Prompt) 하드 주입 전략

수조 개의 일반적인 인터넷 범용 텍스트(General Web Text) 덩어리를 긁어모아 사전 학습(Pre-trained)된 거대 언어 모델(LLM)의 뇌 구조는, 특정 엔터프라이즈 기업의 폐쇄적인 내부 보안 문서나 고도로 파편화된 B2B 도메인 환경 한가운데 던져졌을 때 필연적으로 심각한 **‘용어의 의미론적 충돌(Terminology Collision)’**을 일으키며 붕괴한다.

자비 없는 결정론적 오라클(Oracle)이 채점 작업을 깐깐하게 수행할 때, 기업 내에서 약속된 고유 명사나 레거시 시스템 약어(Acronym)를 모델이 멋대로 범용 일반 명사로 착각하여 잘못된 치명적 오분류 평가(False Negative/Positive)를 내리는 현상은 신뢰도 생태계를 근본적으로 파괴한다.
이를 원천 방어하기 위해, 컨텍스트 윈도우(Context Window)의 최상단 시스템 프롬프트(System Prompt) 선언 단계에서 도메인 특화 용어 사전(Glossary)과 절대 금지어 목록(Blacklist)을 파이썬 딕셔너리처럼 명시적이고 강압적으로 하드 주입(Hard Injection)하는 매핑 전략이 필수적이다.

1. 도메인 용어 사전(Domain Glossary)의 구조화된 어텐션 주입

도메인 용어를 모델의 뇌리에 각인시켜 주입할 때는, 산문 문장 속에 자연어처럼 흘러가듯 섞어 쓰는 방식은 절대 금물이다. 어텐션 가중치(Attention Weight) 메커니즘을 극한으로 쥐어짜 끌어올리기 위해서는 반드시 마크다운(Markdown) 표, 글머리 기호(Bullet points), 혹은 정형화된 JSON 사전(Dictionary) 아키텍처 형식으로 구조화하여 선언적으로 제시해야만 한다.

  • [결정론적 지시문 주입 템플릿 예시]:
    # [DOMAIN GLOSSARY DICTIONARY]
    당신은 텍스트를 파싱할 때, 다음의 사내 도메인 용어 사전을 절대적인 법전 보정 기준으로 삼아야 한다.
    
    - "Project X" : 일반적인 미정 프로젝트가 아니라, '2023년 코어 결제 시스템 클라우드 마이그레이션 T/F'를 정확히 지칭하는 사내 고유 명사이다.
    - "Legacy" : 단순히 '낡은'이라는 범용 형용사가 아니라, '2020년 5월 이전 구축된 온프레미스 구버전 Oracle DB 클러스터 인프라'를 지칭하는 명사다.
    
    평가 대상 텍스트 페이로드 내에서 위 단어(Key)들이 발견되면, 모델이 가진 범용 지식을 즉시 소거하고 반드시 위에 하드코딩 매핑된 정의(Value)만을 기반으로 엄격하게 논리를 전개하라.
    

이처럼 정의를 `Key-Value` 쌍으로 강압 주입하면, 언어 모델은 기존의 방대한 일반 확률 분포 로직에서 강제로 벗어나, 해당 세션 안에서만 국소적으로 유효한 **절대적 의미론 규칙(Local Semantic Rules)**을 따라 파인튜닝(Fine-tuning)된 것처럼 정밀하게 복종 동작하게 된다.

## 2.  금지어 목록(Blacklist)을 통한 환각 우회 경로 원천 차단


오라클의 멱등성(Idempotency)과 일관성을 쇠사슬처럼 확보하는 또 다른 거대한 축은, 모델이 출력해서는 안 되는 더러운 단어나 문장의 형태 모음을 시스템 프롬프트 윗단에 **'절대 금지어 목록(Absolute Blacklist)'**으로 주입하여 가둬버리는 것이다.
이는 앞서 4.2.6절에서 다룬 모델 API의 `Logit Bias` 파라미터 조작과 결과론적으로는 궤를 같이하는 유사한 억제 효과를 내지만, 엔드포인트 하드웨어 레벨의 수학적 토큰 가중치 조작 강제가 아닌, 훨씬 유연한 프롬프트 컨텍스트 레벨의 **'논리적 규약 강제'**라는 점에서 시스템 이적성 차이가 크다.

*   **[블랙리스트 규약 지시문 예시]:**
    ```text
    # [BLACKLIST CONSTRAINTS: DO NOT GENERATE]
    반환되는 구조화 JSON의 'reasoning' 서술 필드에는 대역죄를 지은 것처럼 아래의 단어나 비겁한 표현을 절대 1토큰도 사용하지 마라.
    
    1. "아마도", "것 같습니다", "추측됩니다", "가능성이 높습니다" (어떠한 형태의 비결정적 불확실성을 나타내는 회피성 부사구 원천 금지)
    2. "AI의 판단으로는", "언어 모델로서 저는" (시스템의 자아를 드러내는 메타 인지적 환각 표현 절대 금지)

3. 네거티브 프롬프팅(Negative Prompting)의 어텐션 한계와 Fallback 대안 우회로 설계

여기서 프롬프트 아키텍트가 가장 뼈저리게 주의해야 할 치명적 트레이드오프 점은, 텍스트 생성 모델(Auto-Regressive Generative Model)의 내재적 딥러닝 본성 탓에 *“절대 A를 하지 마라(Don’t think about an elephant)”*라는 네거티브 프롬프팅(Negative Prompting) 지시는 깊은 은닉층에서 이중 부정의 복잡성으로 인해 토큰 어텐션이 꼬이고 지시가 통째로 무시될(Drop) 확률이 통계적으로 매우 높다는 아키텍처적 결함이다.

따라서 금지어 블랙리스트를 작성하여 찌를 때는 *“이 단어들을 절대 쓰지 마라”*는 네거티브 지시 타격과 함께, 반드시 **“대신 이렇게 해라(Do B instead)”**는 명확한 명시적 긍정(Positive) 행동 강령 규칙을 안전한 백업(Fallback) 우회로로 결합 세팅해 주어야만 한다.

“불확실성을 나타내는 ‘아마도’ 같은 비겁한 표현을 쓰지 마라. 대신 당신의 추론 근거 레이더망에 팩트 데이터가 부족하다면 억지로 소설을 지어내지 말고, 단순히 'INSUFFICIENT_EVIDENCE' 라는 상수(Constant) 플래그 하나만 텍스트로 기재한 뒤 시스템을 종료하라.”

이런 식의 숨 쉴 틈 있는 비상 우회로(Fallback Escape Route)를 뚫어 마련해 주어야만, 모델의 뇌는 금지어의 덫에 갇혀 이러지도 저러지도 못한 채 문법 파싱 레이어가 통째로 붕괴되는 현상(Degeneration/Jibberish loop) 에 빠지지 않고, 끝까지 결정론적이고 우아한 JSON 출력을 파이프라인으로 유지해 낼 수 있다.