65.3 희소 보상(Sparse Reward)과 밀집 보상(Dense Reward)
Home
/
제목: 엔비디아 알파마요(Alpamayo)
/
Volume 1. 기초 이론
/
Part 7. 강화 학습 기초
/
Chapter 65. 보상 모델(Reward Mo...
/
65.3 희소 보상(Sparse Reward)과 ...
65.3 희소 보상(Sparse Reward)과 밀집 보상(Dense Reward)