1325.11 보상 함수의 설계와 최적 정책 도출

1325.11 보상 함수의 설계와 최적 정책 도출