10.4.1 가치 함수의 기댓값(Expected Value) 한계와 분포(Distribution) 모델링의 필요성
Home
/
로봇, 자율주행을 위한 Embodied AI & Modern Control
/
Chapter 10. 심층 강화학습(Deep RL)의 고도화
/
10.4 분포 강화학습 (Distributional RL): 기댓값을 넘어서
/
10.4.1 가치 함수의 기댓값(Expected Value) 한계와 분포(Distribution) 모델링의 필요성
10.4.1 가치 함수의 기댓값(Expected Value) 한계와 분포(Distribution) 모델링의 필요성