11.3 상상 속에서의 학습: The Dreamer Architectures

Home / 로봇, 자율주행을 위한 Embodied AI & ... / Chapter 11. 세계 모델과 모델 기반 강화... / 11.3 상상 속에서의 학습: The Dreame...

11.3 상상 속에서의 학습: The Dreamer Architectures

11.3상상 속에서의 학습: The Dreamer Architectures
11.3.1DreamerV1: 잠재 공간에서의 가치 함수 학습과 정책 최적화
11.3.2DreamerV2: 이산적 잠재 변수(Discrete Latent Variables)를 통한 장기 예측 안정화
11.3.3DreamerV3: 스케일링을 위한 Symlog 변환과 하이퍼파라미터 튜닝의 자동화
11.3.4DayDreamer: 물리 로봇을 위한 실시간 온라인 학습 및 배포 전략

Generated by Rust Site Gen