14.5.3.2 승인 기준(Acceptance Criteria) 만족 시 트래픽 자동 전환 라우팅 로직
섀도우 트래픽(Shadow Traffic)을 바탕으로 오라클 병렬 엔진이 수만 건의 A/B 테스트 채점을 실시간으로 쏟아낼 때, 이 거대한 숫자들을 해석하여 “그래서 언제 트래픽 밸브를 꺾을 것인가?“를 결정하는 판단 주체는 인간이 아닌 **‘기계적 승인 기준(Acceptance Criteria)’**이어야 한다.
엔터프라이즈 환경에서는 개발자의 ’감(Gut Feeling)’이나 ’주관적 승인’이 아닌, CD(지속적 배포) 컨트롤러가 YAML로 선언된 오라클의 조건문(Policy)을 1초 단위로 감시하다 통과하는 그 즉시 자동화된 무중단 라우팅 스왑(Zero-Downtime Routing Swap)을 격발 시킨다.
1. 다차원적 선언형 승인 기준 (Multi-dimensional Acceptance Criteria)
Argo CD나 Spinnaker와 같은 지속적 배포 컨트롤러에는, 그린(Green, 신규모델) 환경이 메인(Blue)의 왕좌를 이어받기 위해 반드시 충족해야만 하는 가혹하고 다면적인 승인 조건(Criteria)이 선언적으로 명시되어 있다.
kind: Rollout
strategy:
blueGreen:
autoPromotionSeconds: 3600 # 최소 1시간의 섀도우 검증
postPromotionAnalysis:
templates:
- templateName: oracle-evaluation-criteria
args:
# [결정론적 지표]: 포맷 무결성 에러율이 0.05% 미만일 것
- name: schema-break-rate
threshold: "< 0.05"
# [산술 오라클 지표]: 에러율이 기존 모델(Blue) 이하여야 함 (퇴행 절대 불가)
- name: math-logic-regression
threshold: "<= metric.blue.math-logic-error"
# [의미론적 지표]: LLM 심사관 환각/유해성 적발 건수가 0일 것
- name: toxicity-hallucination-count
threshold: "== 0"
위의 컨트롤 플레인(Control Plane)은 오라클이 보내는 Prometheus 메트릭스 시계열 데이터를 1초 간격으로 폴링(Polling)하며 이 세 가지 조건 고리가 한 치의 오차도 없이 맞물려 돌아가는지를 냉혹하게 심사한다.
2. API 게이트웨이의 원자적(Atomic) 트래픽 스왑 아키텍처
지정된 시간(예: 60분) 동안 수십만 건의 섀도우 트래픽을 처리하며 위의 승인 기준(Acceptance Criteria)을 완벽히 만족시켰다면, CD 컨트롤러는 ’그린 승리(Promotion)’를 선언하고 즉각 API 게이트웨이(Envoy, NGINX 등)에 라우팅 테이블 원자적 변경(Atomic Routing Change) 명령을 쏜다.
- [0 밀리초]: API 게이트웨이의 설정 값
route: blue-service가route: green-service로 변경된다. - [1 밀리초]: 이 순간부터 클라이언트 방향에서 들어오는 100%의 라이브 트래픽은 쿠버네티스의 서비스 VIP(Virtual IP)를 거쳐 새롭게 튜닝된 V2(Green) 컨테이너 인프라로 사정없이 쏟아진다. 기존의 V1(Blue)은 패킷 유입이 완벽히 0(Zero)으로 차단된 상태로 유휴(Idle) 깡통 상태에 돌입한다.
- [Downtime = 0]: 클라이언트 입장에서는 HTTP Connection이 끊기거나 502 Bad Gateway를 마주치는 일 없이, 그저 다음 API 호출부터 눈치채지 못할 만큼 미세하게 더 빠르고 정확해진 인공지능의 답변을 받기 시작할 뿐이다.
3. 치명적 사후 발작 시의 1초 기요틴 롤백 (Instant Auto-Rollback)
초기 승인 기준을 통과하여 100% 왕좌를 차지한 그린(V2) 환경이라 할지라도, AI 특유의 비결정적 특성상 며칠 뒤 갑자기 예상치 못한 악의적 프롬프트 공격에 뚫려 대량의 환각을 터뜨릴 수 있다.
그러나 블루-그린 배포 아키텍처에서 구형 블루(V1) 환경은 즉시 삭제되지 않고 최소 24시간 이상 메모리에 살아 숨 쉰 채(Warm Standby) 대기하고 있다.
만약 운영 감시 모드의 오라클이 그린(V2)의 치명적 정책 위반(예: PII 유출)을 적발해 내면, CD 컨트롤러는 인간 승인자의 마우스 클릭을 1초도 기다리지 않는다. 게이트웨이의 라우팅 방향을 다시 깡통으로 대기 중이던 **구형 V1 환경으로 1밀리초 만에 꺾어버림(Instant Rollback)**으로써, 고객의 체감 오류를 완벽한 0으로 수렴시키며 AI의 광기를 가장 폭력적인 인프라의 힘으로 완전히 도살해 버린다.