VLM (Vision Language Model, 시각 언어 모델) VLM (Vision-Language Models, 시각-언어 모델) 모델 Qwen2.5-VL 멀티모달 비전 언어 모델 LLaVA-OneVision 및 LLaVA-OneVision-1.5: 개방형 멀티모달 모델의 통합 아키텍처와 성능 확장 LLaVA-NeXT (Large Language and Vision Assistant - Next) Q-Former (Querying Transformer) 시각-언어 정렬을 위한 정보 병목 아키텍처 및 파생 모델