10.2 최대 엔트로피 강화학습 (Maximum Entropy RL): Soft Actor-Critic (SAC)

Home / 로봇, 자율주행을 위한 Embodied AI & Modern Control / Chapter 10. 심층 강화학습(Deep RL)의 고도화 / 10.2 최대 엔트로피 강화학습 (Maximum Entropy RL): Soft Actor-Critic (SAC)

10.2 최대 엔트로피 강화학습 (Maximum Entropy RL): Soft Actor-Critic (SAC)

  • 10.2 최대 엔트로피 강화학습 (Maximum Entropy RL): Soft Actor-Critic (SAC)
  • 10.2.1 탐험(Exploration)과 이용(Exploitation)의 균형: 엔트로피 정규화
  • 10.2.2 Soft Actor-Critic(SAC)의 이론적 배경과 아키텍처
  • 10.2.3 자동 온도 조절(Automatic Entropy Adjustment)과 하이퍼파라미터 튜닝 전략

Generated by Rust Site Gen