66.18 GPT 및 BERT 계열 모델의 AdamW 하이퍼파라미터 설정 사례

66.18 GPT 및 BERT 계열 모델의 AdamW 하이퍼파라미터 설정 사례