7.2 평가 모델(Judge Model) 선정과 아키텍처 패턴
- 7.2.1 강력한 모델(Strong Model)을 이용한 약한 모델(Weak Model) 평가 전략
- 7.2.2 동일 모델 간의 교차 검증(Cross-Validation)과 자기 비평(Self-Correction)
- 7.2.3 Pairwise Comparison(쌍별 비교) 방식의 승자 판별 오라클
- 7.2.4 Single Point Grading(단일 점수 채점) 방식의 절대 평가 오라클
- 7.2.5 Panel of Judges: 다수 LLM 합의(Consensus) 기반의 투표 시스템
- 7.2.6 도메인 특화 소형 언어 모델(sLLM)을 활용한 평가 전용 미세조정(Fine-tuning)