17.1.3 행동을 언어처럼 다루기: 텍스트 토큰과 행동 토큰의 통합 공간
Home
/
로봇, 자율주행을 위한 Embodied AI & Modern Control
/
Chapter 17. 시각-언어-행동 모델 (Vision-Language-Action Models, VLA)
/
17.1 VLM을 넘어 VLA로: 행동하는 파운데이션 모델
/
17.1.3 행동을 언어처럼 다루기: 텍스트 토큰과 행동 토큰의 통합 공간
17.1.3 행동을 언어처럼 다루기: 텍스트 토큰과 행동 토큰의 통합 공간