10.2.3 자동 온도 조절(Automatic Entropy Adjustment)과 하이퍼파라미터 튜닝 전략
Home
/
로봇, 자율주행을 위한 Embodied AI & Modern Control
/
Chapter 10. 심층 강화학습(Deep RL)의 고도화
/
10.2 최대 엔트로피 강화학습 (Maximum Entropy RL): Soft Actor-Critic (SAC)
/
10.2.3 자동 온도 조절(Automatic Entropy Adjustment)과 하이퍼파라미터 튜닝 전략
10.2.3 자동 온도 조절(Automatic Entropy Adjustment)과 하이퍼파라미터 튜닝 전략