26.6.1 기존 벤치마크의 한계: 특정 태스크 성공률(Success Rate) 측정의 무의미함
Home
/
로봇, 자율주행을 위한 Embodied AI & Modern Control
/
Chapter 26. 일반 범용 로봇(Generalist Robot)을 향한 여정
/
26.6 일반화 성능 평가: 새로운 튜링 테스트
/
26.6.1 기존 벤치마크의 한계: 특정 태스크 성공률(Success Rate) 측정의 무의미함
26.6.1 기존 벤치마크의 한계: 특정 태스크 성공률(Success Rate) 측정의 무의미함