12.5.3 확산 모델 기반 정책 (Diffusion Policies)과 오프라인 RL의 결합
Home
/
로봇, 자율주행을 위한 Embodied AI & ...
/
Chapter 12. 오프라인 강화학습 (Offl...
/
12.5 패러다임의 확장: 시퀀스 모델링으로서의 ...
/
12.5.3 확산 모델 기반 정책 (Diffusi...
12.5.3 확산 모델 기반 정책 (Diffusion Policies)과 오프라인 RL의 결합