66.1 강화 학습 기반 미세 조정의 동기

66.1 강화 학습 기반 미세 조정의 동기