17.1 VLM을 넘어 VLA로: 행동하는 파운데이션 모델

Home / 로봇, 자율주행을 위한 Embodied AI & Modern Control / Chapter 17. 시각-언어-행동 모델 (Vision-Language-Action Models, VLA) / 17.1 VLM을 넘어 VLA로: 행동하는 파운데이션 모델

17.1 VLM을 넘어 VLA로: 행동하는 파운데이션 모델

  • 17.1 VLM을 넘어 VLA로: 행동하는 파운데이션 모델
  • 17.1.1 VLA의 정의: ‘보다(See)’, ’말하다(Speak)’에서 ’움직이다(Act)’로의 확장
  • 17.1.2 파이프라인 구조와의 비교: 인지-판단-제어의 통합 (End-to-End)
  • 17.1.3 행동을 언어처럼 다루기: 텍스트 토큰과 행동 토큰의 통합 공간

Generated by Rust Site Gen