17.2.3 VLA 트랜스포머 아키텍처: 비전 인코더와 LLM 백본의 결합
Home
/
로봇, 자율주행을 위한 Embodied AI & Modern Control
/
Chapter 17. 시각-언어-행동 모델 (Vision-Language-Action Models, VLA)
/
17.2 행동 토큰화(Action Tokenization)와 아키텍처
/
17.2.3 VLA 트랜스포머 아키텍처: 비전 인코더와 LLM 백본의 결합
17.2.3 VLA 트랜스포머 아키텍처: 비전 인코더와 LLM 백본의 결합