VLM (Vision Language Model, 시각 언어 모델)

Home / 인공지능 (Artificial Intelligence, AI) / VLM (Vision Language Model, 시각 언어 모델)

VLM (Vision Language Model, 시각 언어 모델)

  • VLM (Vision-Language Models, 시각-언어 모델)

모델

  • Qwen2.5-VL 멀티모달 비전 언어 모델
  • LLaVA-OneVision 및 LLaVA-OneVision-1.5: 개방형 멀티모달 모델의 통합 아키텍처와 성능 확장
  • LLaVA-NeXT (Large Language and Vision Assistant - Next)
  • Q-Former (Querying Transformer) 시각-언어 정렬을 위한 정보 병목 아키텍처 및 파생 모델

Generated by Rust Site Gen