67.7 GRPO의 이점 추정 방법