10.4.1 가치 함수의 기댓값(Expected Value) 한계와 분포(Distribution) 모델링의 필요성
Home
/
로봇, 자율주행을 위한 Embodied AI & ...
/
Chapter 10. 심층 강화학습(Deep RL...
/
10.4 분포 강화학습 (Distributiona...
/
10.4.1 가치 함수의 기댓값(Expected ...
10.4.1 가치 함수의 기댓값(Expected Value) 한계와 분포(Distribution) 모델링의 필요성