68.3 배치 데이터(Batch Data)를 이용한 정책 학습

68.3 배치 데이터(Batch Data)를 이용한 정책 학습