10.3.1 로봇 조작(Manipulation)에서의 보상 설계 난제

Home / 로봇, 자율주행을 위한 Embodied AI & Modern Control / Chapter 10. 심층 강화학습(Deep RL)의 고도화 / 10.3 희소 보상(Sparse Reward) 문제의 해결: 목표 기반 RL (Goal-Conditioned RL) / 10.3.1 로봇 조작(Manipulation)에서의 보상 설계 난제

10.3.1 로봇 조작(Manipulation)에서의 보상 설계 난제

Generated by Rust Site Gen