13.1.1 차원의 저주와 시간의 저주: 타임 스텝이 길어질수록 기하급수적으로 증가하는 탐색 공간과 신용 할당(Credit Assignment) 문제 분석
Home
/
로봇, 자율주행을 위한 Embodied AI & Modern Control
/
Chapter 13. 계층적 강화학습과 스킬 발견 (Hierarchical RL & Skill Discovery)
/
13.1 시간적 추상화와 장기 계획의 난제 (Temporal Abstraction & Long-Horizon Problems)
/
13.1.1 차원의 저주와 시간의 저주: 타임 스텝이 길어질수록 기하급수적으로 증가하는 탐색 공간과 신용 할당(Credit Assignment) 문제 분석
13.1.1 차원의 저주와 시간의 저주: 타임 스텝이 길어질수록 기하급수적으로 증가하는 탐색 공간과 신용 할당(Credit Assignment) 문제 분석