17.2.3 VLA 트랜스포머 아키텍처: 비전 인코더와 LLM 백본의 결합

Home / 로봇, 자율주행을 위한 Embodied AI & Modern Control / Chapter 17. 시각-언어-행동 모델 (Vision-Language-Action Models, VLA) / 17.2 행동 토큰화(Action Tokenization)와 아키텍처 / 17.2.3 VLA 트랜스포머 아키텍처: 비전 인코더와 LLM 백본의 결합

17.2.3 VLA 트랜스포머 아키텍처: 비전 인코더와 LLM 백본의 결합

Generated by Rust Site Gen