67.2 PPO 기반 강화 학습의 한계

67.2 PPO 기반 강화 학습의 한계