9.6.1 행동이 아닌 보상 함수(Reward Function)의 추론

Home / 로봇, 자율주행을 위한 Embodied AI & ... / Chapter 9. 모방 학습 (Imitation... / 9.6 의도를 학습하다: 역강화학습 (Invers... / 9.6.1 행동이 아닌 보상 함수(Reward F...

9.6.1 행동이 아닌 보상 함수(Reward Function)의 추론

Generated by Rust Site Gen