13.2.2 Semi-Markov Decision Process (SMDP): 가변적인 시간 간격을 다루기 위한 MDP의 확장 이론
Home
/
로봇, 자율주행을 위한 Embodied AI & ...
/
Chapter 13. 계층적 강화학습과 스킬 발견...
/
13.2 옵션 프레임워크와 SMDP (The Op...
/
13.2.2 Semi-Markov Decision...
13.2.2 Semi-Markov Decision Process (SMDP): 가변적인 시간 간격을 다루기 위한 MDP의 확장 이론