25.5.2 라그랑주 이완(Lagrangian Relaxation)과 원초-쌍대(Primal-Dual) 최적화
Home
/
로봇, 자율주행을 위한 Embodied AI & Modern Control
/
Chapter 25. 안전한 제어와 이론적 보증 (Safe Control & Theoretical Guarantees)
/
25.5 제약 조건이 있는 강화학습 (Constrained MDPs & Safe RL)
/
25.5.2 라그랑주 이완(Lagrangian Relaxation)과 원초-쌍대(Primal-Dual) 최적화
25.5.2 라그랑주 이완(Lagrangian Relaxation)과 원초-쌍대(Primal-Dual) 최적화