77.17 Pre-LayerNorm 트랜스포머의 학습 안정성 향상 메커니즘

77.17 Pre-LayerNorm 트랜스포머의 학습 안정성 향상 메커니즘