16.4 픽셀 수준의 이해: 세그멘테이션과 어포던스

Home / 로봇, 자율주행을 위한 Embodied AI & Modern Control / Chapter 16. 시각-언어 모델과 개방형 어휘 인식 (VLMs & Open-Vocabulary Perception) / 16.4 픽셀 수준의 이해: 세그멘테이션과 어포던스

16.4 픽셀 수준의 이해: 세그멘테이션과 어포던스

  • 16.4 픽셀 수준의 이해: 세그멘테이션과 어포던스
  • 16.4.1 SAM(Segment Anything Model)과 VLM의 결합: Semantic-SAM, SEEM
  • 16.4.2 파트(Part) 레벨 인식: 로봇이 잡아야 할 손잡이(Handle)와 뚜껑(Lid) 구분하기
  • 16.4.3 어포던스(Affordance) 그라운딩: “앉을 수 있는 곳”, “열 수 있는 곳“의 시각화

Generated by Rust Site Gen