12.1 온라인 탐색의 한계와 오프라인 RL의 부상

Home / 로봇, 자율주행을 위한 Embodied AI & ... / Chapter 12. 오프라인 강화학습 (Offl... / 12.1 온라인 탐색의 한계와 오프라인 RL의 부상

12.1 온라인 탐색의 한계와 오프라인 RL의 부상

  • 12.1온라인 탐색의 한계와 오프라인 RL의 부상
  • 12.1.1로봇 학습의 딜레마: 데이터 수집 비용과 안전성 문제
  • 12.1.2오프라인 RL vs 모방 학습: 보상(Reward)을 통한 전문가 초월하기
  • 12.1.3데이터 중심(Data-Centric) AI로의 전환: 알고리즘보다 데이터셋의 중요성

Generated by Rust Site Gen