10.1.3 로봇공학에서의 ‘죽음의 3요소(Deadly Triad)’와 학습 불안정성 해결
Home
/
로봇, 자율주행을 위한 Embodied AI & Modern Control
/
Chapter 10. 심층 강화학습(Deep RL)의 고도화
/
10.1 연속 제어(Continuous Control)와 표본 효율성 (Sample Efficiency)
/
10.1.3 로봇공학에서의 ‘죽음의 3요소(Deadly Triad)’와 학습 불안정성 해결
10.1.3 로봇공학에서의 ‘죽음의 3요소(Deadly Triad)’와 학습 불안정성 해결