17.1 VLM을 넘어 VLA로: 행동하는 파운데이션 모델

Home / 로봇, 자율주행을 위한 Embodied AI & ... / Chapter 17. 시각-언어-행동 모델 (Vi... / 17.1 VLM을 넘어 VLA로: 행동하는 파운데...

17.1 VLM을 넘어 VLA로: 행동하는 파운데이션 모델

17.1VLM을 넘어 VLA로: 행동하는 파운데이션 모델
17.1.1VLA의 정의: ‘보다(See)’, ’말하다(Speak)’에서 ’움직이다(Act)’로의 확장
17.1.2파이프라인 구조와의 비교: 인지-판단-제어의 통합 (End-to-End)
17.1.3행동을 언어처럼 다루기: 텍스트 토큰과 행동 토큰의 통합 공간

Generated by Rust Site Gen