11.1.2 환경 모델링의 정의: 전이 함수(Transition Function)와 보상 함수(Reward Function)의 학습
Home
/
로봇, 자율주행을 위한 Embodied AI & ...
/
Chapter 11. 세계 모델과 모델 기반 강화...
/
11.1 모델 기반 제어의 부상: 왜 모델이 필요한가?
/
11.1.2 환경 모델링의 정의: 전이 함수(Tr...
11.1.2 환경 모델링의 정의: 전이 함수(Transition Function)와 보상 함수(Reward Function)의 학습