10.2.1 탐험(Exploration)과 이용(Exploitation)의 균형: 엔트로피 정규화

Home / 로봇, 자율주행을 위한 Embodied AI & ... / Chapter 10. 심층 강화학습(Deep RL... / 10.2 최대 엔트로피 강화학습 (Maximum ... / 10.2.1 탐험(Exploration)과 이용(...

10.2.1 탐험(Exploration)과 이용(Exploitation)의 균형: 엔트로피 정규화

Generated by Rust Site Gen