15.1 AI 기반 소프트웨어 개발에서 ’기술 부채’의 재정의

전통적인 소프트웨어 공학에서 ’기술 부채(Technical Debt)’는 일정을 맞추기 위해 타협한 코드의 품질, 하드코딩된 변수, 혹은 주석 없이 방치된 레거시(Legacy) 코드를 의미했다. 이는 시간이 지날수록 리팩토링(Refactoring) 비용의 이자를 발생시키는 코드 레벨의 물리적 결함이었다. 그러나 거대 언어 모델(LLM)과 같은 비결정론적 AI가 시스템의 중심 코어가 된 현시대의 파이프라인에서, 기술 부채의 개념은 코드의 경계를 넘어 데이터와 프롬프트, 그리고 이를 검증하는 오라클(Oracle)의 생태계 전반으로 그 의미가 근본적으로 재정의된다.

구글(Google)의 연구 논문 Machine Learning: The High Interest Credit Card of Technical Debt에서 경고했듯, AI 시스템의 부채는 보이지 않는 곳에서 시스템을 조용히 무너뜨리는 악성 채무와 같다. 본 단원에서는 AI 주도 개발(AI-driven Development) 환경에서 엔지니어가 짊어지게 되는 새로운 형태의 기술 부채들을 분류하고 그 위험성을 명확히 정의한다.

1. 프롬프트 부채 (Prompt Debt)

자연어 프롬프트는 AI 시대의 새로운 소스 코드다. 시스템 프롬프트(System Prompt)가 여러 번의 급한 릴리스(Release)를 거치며 땜질식(Patchwork)으로 진화할 때 프롬프트 부채가 쌓인다.

증상: “A 조건에서는 JSON으로, B 조건에서는 텍스트로 응답하되, C 예외가 발생하면 무시하라“는 식의 장황하고 상충하는 지시어들이 하나의 거대한 프롬프트에 엉켜있는 스파게티 프롬프트(Spaghetti Prompt) 현상이다.
리스크: 모델이 업데이트되거나 컨텍스트 윈도우 한계에 다다르면, 모델이 어떤 지시를 따르고 어떤 지시를 무시(Attention Drop)할지 예측할 수 없는 심각한 비결정성을 초래한다.

2. 모델 및 지식 베이스 드리프트 (Model & Knowledge Drift)

일반적인 소프트웨어 생태계의 의존성 패키지(Libraries)는 개발자가 버전을 고정(Pinning)하면 불변의 동작을 보장한다. 그러나 API 형태로 제공되는 LLM이나 Vector DB의 지식은 다르다.

증상: OpenAI나 Anthropic과 같은 벤더 제공자가 백그라운드에서 모델 가중치를 ’잠수함 패치(Silent Patch)’하거나, RAG 시스템의 문서 저장소 내용이 오래된 정보로 가득 차 있을 때 발생한다.
리스크: 코드는 단 한 줄도 바뀌지 않았음에도 불구하고, 어제 통과했던 시스템 내의 모든 결정론적 테스트(오라클)가 오늘 갑자기 원인 불명의 대규모 Fail을 뱉어내는 환경적 부채의 형태를 띤다.

3. 오라클 부채 (Oracle Debt) - 가장 치명적인 그림자

AI 시스템 결함의 핵심은 AI 모델 자체의 오류보다, 그 오류를 감지해야 할 방어 체계 자체가 노후화되는 데 있다. 이를 우리는 **오라클 부채(Oracle Debt)**라 명명한다.

정답지 노후화(Stale Ground Truth): 비즈니스 룰은 매일 변경되지만, 이를 채점하는 골든 데이터셋(Golden Dataset)과 테스트 코드가 1년 전의 데이터에 머물러 있는 현상이다. AI가 최신 룰에 맞춰 정답을 도출해도 낡은 오라클이 이를 ’오답’으로 차단한다.
과잉 적합된 검증 로직(Overfitted Validation): “단어가 반드시 3개여야 한다“거나 “특정 띄어쓰기를 지켜라” 식의 과도하게 빡빡하고 의미 없는 문자열(Regex) 오라클 설계로 인해, 정상적인 모델의 출력조차 버그로 판정해버리는 취약한 테스트(Test Brittleness)를 의미한다.

AI 기반 소프트웨어 시스템에서의 기술 부채는 더 이상 “나중에 리팩토링하면 되는” 가벼운 타협이 아니다. 방치된 프롬프트와 녹슨 오라클 파이프라인은 확률론적 AI의 통제력을 완전히 상실하게 만들며, 결과적으로 프로덕션(Production) 환경에 환각(Hallucination)이라는 치명적인 재앙을 쏟아내는 기폭제로 작용하게 될 것이다.