72.13 SwiGLU의 역전파 그래디언트 유도와 편미분 체인 규칙 적용
Home
/
거대 AI 마스터클래스
/
Volume 1. 인공지능과 딥러닝의 수학적/구조...
/
Part 3. 연결주의의 태동과 딥러닝 기초 최적화
/
Chapter 72. 게이트 선형 유닛: GLU ...
/
72.13 SwiGLU의 역전파 그래디언트 유도와...
72.13 SwiGLU의 역전파 그래디언트 유도와 편미분 체인 규칙 적용