6.2.1 CLIP (Contrastive Language-Image Pre-training)의 원리: 이미지와 텍스트를 동일한 잠재 공간(Latent Space)에 매핑하기.
Home
/
로봇, 자율주행을 위한 Embodied AI & ...
/
Chapter 6. 오픈 보캐블러리와 시맨틱 이해...
/
6.2 시각과 언어의 연결: 멀티모달 임베딩 (M...
/
6.2.1 CLIP (Contrastive Lan...
6.2.1 CLIP (Contrastive Language-Image Pre-training)의 원리: 이미지와 텍스트를 동일한 잠재 공간(Latent Space)에 매핑하기.