Chapter 22. 멀티헤드 어텐션(Multi-Head Attention) Chapter 22. 멀티헤드 어텐션(Multi-Head Attention) 22.1멀티헤드 어텐션의 동기와 필요성 22.2멀티헤드 어텐션의 구조 22.3헤드별 선형 투영(Linear Projection) 22.4병렬 어텐션 헤드의 연산 과정 22.5헤드 출력의 연결(Concatenation)과 최종 투영 22.6헤드 수와 차원 분할의 관계 22.7멀티헤드 어텐션의 매개변수 수 분석 22.8단일 헤드 어텐션과 멀티헤드 어텐션의 비교 22.9어텐션 헤드의 역할 분화 현상 22.10멀티헤드 어텐션의 구현 최적화