11.3 상상 속에서의 학습: The Dreamer Architectures

Home / 로봇, 자율주행을 위한 Embodied AI & Modern Control / Chapter 11. 세계 모델과 모델 기반 강화학습 (World Models & Model-Based RL) / 11.3 상상 속에서의 학습: The Dreamer Architectures

11.3 상상 속에서의 학습: The Dreamer Architectures

  • 11.3 상상 속에서의 학습: The Dreamer Architectures
  • 11.3.1 DreamerV1: 잠재 공간에서의 가치 함수 학습과 정책 최적화
  • 11.3.2 DreamerV2: 이산적 잠재 변수(Discrete Latent Variables)를 통한 장기 예측 안정화
  • 11.3.3 DreamerV3: 스케일링을 위한 Symlog 변환과 하이퍼파라미터 튜닝의 자동화
  • 11.3.4 DayDreamer: 물리 로봇을 위한 실시간 온라인 학습 및 배포 전략

Generated by Rust Site Gen