11.3.1 DreamerV1: 잠재 공간에서의 가치 함수 학습과 정책 최적화
Home
/
로봇, 자율주행을 위한 Embodied AI & Modern Control
/
Chapter 11. 세계 모델과 모델 기반 강화학습 (World Models & Model-Based RL)
/
11.3 상상 속에서의 학습: The Dreamer Architectures
/
11.3.1 DreamerV1: 잠재 공간에서의 가치 함수 학습과 정책 최적화
11.3.1 DreamerV1: 잠재 공간에서의 가치 함수 학습과 정책 최적화