17.2 행동 토큰화(Action Tokenization)와 아키텍처

Home / 로봇, 자율주행을 위한 Embodied AI & Modern Control / Chapter 17. 시각-언어-행동 모델 (Vision-Language-Action Models, VLA) / 17.2 행동 토큰화(Action Tokenization)와 아키텍처

17.2 행동 토큰화(Action Tokenization)와 아키텍처

  • 17.2 행동 토큰화(Action Tokenization)와 아키텍처
  • 17.2.1 연속적인 로봇 제어 신호의 이산화 (Discretization) 기법
  • 17.2.2 토큰화 전략: Uniform Binning vs. 학습된 토크나이저(VQ-VAE)
  • 17.2.3 VLA 트랜스포머 아키텍처: 비전 인코더와 LLM 백본의 결합
  • 17.2.4 행동 출력의 디코딩(Decoding)과 De-tokenization 프로세스

Generated by Rust Site Gen