10.5.2 DrQ(Data-regularized Q), CURL: 일관성 정규화(Consistency Regularization)와 대조 학습
Home
/
로봇, 자율주행을 위한 Embodied AI & Modern Control
/
Chapter 10. 심층 강화학습(Deep RL)의 고도화
/
10.5 시각적 강화학습과 데이터 증강 (Data-Regularized Visual RL)
/
10.5.2 DrQ(Data-regularized Q), CURL: 일관성 정규화(Consistency Regularization)와 대조 학습
10.5.2 DrQ(Data-regularized Q), CURL: 일관성 정규화(Consistency Regularization)와 대조 학습