10.3.1 로봇 조작(Manipulation)에서의 보상 설계 난제
Home
/
로봇, 자율주행을 위한 Embodied AI & Modern Control
/
Chapter 10. 심층 강화학습(Deep RL)의 고도화
/
10.3 희소 보상(Sparse Reward) 문제의 해결: 목표 기반 RL (Goal-Conditioned RL)
/
10.3.1 로봇 조작(Manipulation)에서의 보상 설계 난제
10.3.1 로봇 조작(Manipulation)에서의 보상 설계 난제