12.1.1 텍스트 유사도 기반 평가(BLEU, Rouge)의 한계와 무용성