→ Text Generation을 위한 자동 Evaluation Metric인 BERTScore 제시. Contextual Embedding으로 Reference Sentence와 Candidate Sentence간의 Token Similarity를 계산 기존 n-gram matching 방식 래퍼런스 문장과 후보 문장의 n그램을 비교. 정확한 위치와 n그램 길이에 제한적. ex) BLEU, METEOR BERTScore → contextual embedding(BERT, ELMo) 은 word embedding 과 달리 문장에 따라 같은 단어여도 다른 vector representations를 생성. DATASET WMT18 dataset. (en↔cs, en↔de, en↔et, en↔fi, en↔ru..