12.1 온라인 탐색의 한계와 오프라인 RL의 부상

Home / 로봇, 자율주행을 위한 Embodied AI & Modern Control / Chapter 12. 오프라인 강화학습 (Offline RL): 정적 데이터셋의 가치 / 12.1 온라인 탐색의 한계와 오프라인 RL의 부상

12.1 온라인 탐색의 한계와 오프라인 RL의 부상

  • 12.1 온라인 탐색의 한계와 오프라인 RL의 부상
  • 12.1.1 로봇 학습의 딜레마: 데이터 수집 비용과 안전성 문제
  • 12.1.2 오프라인 RL vs 모방 학습: 보상(Reward)을 통한 전문가 초월하기
  • 12.1.3 데이터 중심(Data-Centric) AI로의 전환: 알고리즘보다 데이터셋의 중요성

Generated by Rust Site Gen