16.3.1 ViLD(Vision-Language Distillation)와 OWL-ViT: 텍스트 쿼리로 Bounding Box 추출하기
Home
/
로봇, 자율주행을 위한 Embodied AI & Modern Control
/
Chapter 16. 시각-언어 모델과 개방형 어휘 인식 (VLMs & Open-Vocabulary Perception)
/
16.3 텍스트 프롬프트 기반 객체 탐지 (Open-Vocabulary Object Detection)
/
16.3.1 ViLD(Vision-Language Distillation)와 OWL-ViT: 텍스트 쿼리로 Bounding Box 추출하기
16.3.1 ViLD(Vision-Language Distillation)와 OWL-ViT: 텍스트 쿼리로 Bounding Box 추출하기