71.7 대규모 언어 모델(GPT, BERT) 아키텍처에서 GELU 채택의 경험적 근거와 성능 벤치마크 분석

71.7 대규모 언어 모델(GPT, BERT) 아키텍처에서 GELU 채택의 경험적 근거와 성능 벤치마크 분석