26.5 AdamW 최적화기와 가중치 감쇠
Home
/
엔비디아 알파마요(Alpamayo)
/
Volume 1. 기초 이론
/
Part 3. 트랜스포머와 어텐션 메커니즘
/
Chapter 26. 트랜스포머의 학습과 최적화
/
26.5 AdamW 최적화기와 가중치 감쇠
26.5 AdamW 최적화기와 가중치 감쇠