28.5.1 인간 피드백 기반 강화학습(RLHF)의 로봇 제어 적용
Home
/
로봇, 자율주행을 위한 Embodied AI & Modern Control
/
Chapter 28. 신뢰할 수 있는 로봇 지능 (Trustworthy Embodied AI)
/
28.5 로봇을 위한 가치 정렬 (Value Alignment for Robotics)
/
28.5.1 인간 피드백 기반 강화학습(RLHF)의 로봇 제어 적용
28.5.1 인간 피드백 기반 강화학습(RLHF)의 로봇 제어 적용