9.6 의도를 학습하다: 역강화학습 (Inverse RL)과 GAIL

Home / 로봇, 자율주행을 위한 Embodied AI & ... / Chapter 9. 모방 학습 (Imitation... / 9.6 의도를 학습하다: 역강화학습 (Invers...

9.6 의도를 학습하다: 역강화학습 (Inverse RL)과 GAIL

9.6의도를 학습하다: 역강화학습 (Inverse RL)과 GAIL
9.6.1행동이 아닌 보상 함수(Reward Function)의 추론
9.6.2생성적 적대 모방 학습(GAIL)의 아키텍처
9.6.3판별기(Discriminator)를 활용한 전문가 행동과 에이전트 행동의 정렬

Generated by Rust Site Gen