71.7 대규모 언어 모델(GPT, BERT) 아키텍처에서 GELU 채택의 경험적 근거와 성능 벤치마크 분석
Home
/
거대 AI 마스터클래스
/
Volume 1. 인공지능과 딥러닝의 수학적/구조...
/
Part 3. 연결주의의 태동과 딥러닝 기초 최적화
/
Chapter 71. 고급 활성화 함수 2: Sw...
/
71.7 대규모 언어 모델(GPT, BERT) 아...
71.7 대규모 언어 모델(GPT, BERT) 아키텍처에서 GELU 채택의 경험적 근거와 성능 벤치마크 분석