13.6.1 비정상성(Non-stationarity) 문제: 하위 정책이 변할 때 상위 정책이 겪는 학습 불안정성 해결 (Hindsight Replay 활용 등)
Home
/
로봇, 자율주행을 위한 Embodied AI & Modern Control
/
Chapter 13. 계층적 강화학습과 스킬 발견 (Hierarchical RL & Skill Discovery)
/
13.6 계층적 학습의 주요 도전 과제와 미래 (Challenges & Future)
/
13.6.1 비정상성(Non-stationarity) 문제: 하위 정책이 변할 때 상위 정책이 겪는 학습 불안정성 해결 (Hindsight Replay 활용 등)
13.6.1 비정상성(Non-stationarity) 문제: 하위 정책이 변할 때 상위 정책이 겪는 학습 불안정성 해결 (Hindsight Replay 활용 등)