16.4 픽셀 수준의 이해: 세그멘테이션과 어포던스

Home / 로봇, 자율주행을 위한 Embodied AI & ... / Chapter 16. 시각-언어 모델과 개방형 어... / 16.4 픽셀 수준의 이해: 세그멘테이션과 어포던스

16.4 픽셀 수준의 이해: 세그멘테이션과 어포던스

16.4픽셀 수준의 이해: 세그멘테이션과 어포던스
16.4.1SAM(Segment Anything Model)과 VLM의 결합: Semantic-SAM, SEEM
16.4.2파트(Part) 레벨 인식: 로봇이 잡아야 할 손잡이(Handle)와 뚜껑(Lid) 구분하기
16.4.3어포던스(Affordance) 그라운딩: “앉을 수 있는 곳”, “열 수 있는 곳“의 시각화

Generated by Rust Site Gen