10.4 분포 강화학습 (Distributional RL): 기댓값을 넘어서

Home / 로봇, 자율주행을 위한 Embodied AI & ... / Chapter 10. 심층 강화학습(Deep RL... / 10.4 분포 강화학습 (Distributiona...

10.4 분포 강화학습 (Distributional RL): 기댓값을 넘어서

10.4분포 강화학습 (Distributional RL): 기댓값을 넘어서
10.4.1가치 함수의 기댓값(Expected Value) 한계와 분포(Distribution) 모델링의 필요성
10.4.2C51, QR-DQN에서 IQN(Implicit Quantile Networks)까지의 발전
10.4.3위험 회피(Risk-Averse) 제어와 불확실성 하에서의 로봇 의사결정

Generated by Rust Site Gen