14.8.4 서버리스(Serverless) 아키텍처를 활용한 비용 효율적인 오라클 실행
결정론적 오라클은 메인 AI 모델처럼 24시간 365일 내내 클러스터에 상주하며 라이브 트래픽을 처리할 필요가 없다. 오라클은 오직 ‘새로운 PR이 머지되거나’, ’정해진 지연 샘플링 큐에 데이터가 쌓였을 때’만 간헐적(Intermittent)으로 깨어나 폭발적인 연산을 수행하고 다시 잠들면 된다.
만약 이 오라클들을 위해 무거운 쿠버네티스 노드나 EC2 인스턴스를 상시 프로비저닝(Provisioning)해둔다면, 그것은 가장 끔찍한 형태의 클라우드 비용(Cloud Cost) 낭비다. 가장 경제적이고 탄력적인 오라클 인프라는 서버리스(Serverless) 아키텍처 위에 구축되어야 한다.
1. 이벤트 주도형(Event-driven) 오라클 격발
서버리스 오라클의 핵심은 철저한 ‘이벤트 주도(Event-driven)’ 방식이다. 오라클 함수 그 자체는 평소에 0원의 비용으로 휴면 상태를 유지하다가, 특정 이벤트가 캐치되는 1밀리초의 순간에만 인프라에 스폰된다.
- [AWS Lambda / Azure Functions]:
가벼운 Pydantic 스키마 검증이나 정규식(Regex) 기반의 팩트 체크 오라클이라면 함수형 컴퓨팅(FaaS) 모델이 가장 적합하다.
메인 컨테이너가 생성한 응답 텍스트가 AWS SQS나 Kafka 큐에[Type: Ready-to-Eval]이라는 메시지 헤더를 달고 떨어지는 순간, 이를 구독(Subscribe)하고 있던 AWS Lambda 함수 수천 개가 동시에 깨어나 병렬로 채점을 마친 뒤 1초 만에 흔적도 없이 소멸하여 과금을 멈춘다. - [GCP Cloud Run / AWS Fargate]:
만약 NLI 분류기나 경량 임베딩 모델(예: Sentence-Transformers)을 로드하기 위해 컨테이너 단위의 고용량 메모리(RAM)나 약간의 GPU 가속이 필요하다면 Cloud Run이나 Fargate를 선택한다. 이들은 HTTP 요청이나 이벤트 버스 신호가 들어올 때 즉시 컨테이너를 콜드 스타트(Cold Start) 시켜 작업을 처리하고, 트래픽이 0이 되면 즉시 스케일 다운(Scale-to-zero)된다.
2. 비용 모델(Cost Model)의 극단적 최적화
상시 구동되는 쿠버네티스(k8s) 파드 100개를 유지하는 것과, 서버리스 아키텍처로 오라클을 구동하는 것 사이에는 수십 배의 비용 차이가 존재한다.
- 초 단위, 밀리초 단위 과금: 오라클이 1만 건의 골든 데이터셋을 채점하는 데 정확히 15분이 걸린다면, 기업은 단 15분어치의 컴퓨팅 비용만 지불한다.
- 병렬 확장의 한계 없음: 만약 14.5.3절의 블루-그린 배포가 일어나는 긴박한 A/B 테스트 상황에서, 갑자기 트래픽이 100배로 폭증한다고 해도 서버리스 오라클은 인프라 팀의 개입 없이 스스로 동시 실행 워커를 100개에서 10,000개로 수평 확장(Scale-out)하여 큐에 쌓인 평가 페이로드 대기열을 순식간에 녹여버린다.
3. 지속적 배포 파이프라인과의 아키텍처 결합
이러한 서버리스 오라클 환경은 앞서 구축한 CI/CD(GitHub Actions 등) 스크립트 구조를 다음과 같이 우아하게 변경시킨다.
과거에는 CI 러너(Runner)가 직접 무거운 파이썬 pytest를 메모리에 올려 장시간 실행했다면, 이제 CI 스크립트는 **“서버리스 오라클 API(Webhook)를 찌르고 결과만 기다리는 가벼운 오케스트레이터”**로 변모한다.
# 서버리스 오라클 호출 방식의 CI 스텝 예시
- name: 서버리스 오라클 평가 격발 (Trigger Serverless Oracle)
run: |
# Lambda 또는 CloudRun 엔드포인트 호출
curl -X POST https://oracle.serverless.com/evaluate \
-H "Authorization: Bearer ${{ secrets.ORACLE_TOKEN }}" \
-d '{"model_endpoint": "green-v2", "golden_dataset": "v3-latest"}'
# 폴링(Polling) 방식으로 결과 대기
# ...
결과적으로, 인프라스트럭처의 비대함을 덜어낸 ’서버리스 오라클’은 MLOps 팀에게 비용 절감이라는 가장 현실적인 무기를 쥐여주는 동시에, AI 애플리케이션의 검증 속도를 극한으로 끌어올리는 현대 클라우드 엔지니어링의 백미라 할 수 있다.