12.5.3 확산 모델 기반 정책 (Diffusion Policies)과 오프라인 RL의 결합

Home / 로봇, 자율주행을 위한 Embodied AI & ... / Chapter 12. 오프라인 강화학습 (Offl... / 12.5 패러다임의 확장: 시퀀스 모델링으로서의 ... / 12.5.3 확산 모델 기반 정책 (Diffusi...

12.5.3 확산 모델 기반 정책 (Diffusion Policies)과 오프라인 RL의 결합

Generated by Rust Site Gen