25.5.1 CMDP(Constrained Markov Decision Process)의 정식화

Home / 로봇, 자율주행을 위한 Embodied AI & Modern Control / Chapter 25. 안전한 제어와 이론적 보증 (Safe Control & Theoretical Guarantees) / 25.5 제약 조건이 있는 강화학습 (Constrained MDPs & Safe RL) / 25.5.1 CMDP(Constrained Markov Decision Process)의 정식화

25.5.1 CMDP(Constrained Markov Decision Process)의 정식화

Generated by Rust Site Gen