mteval-v13a.pl和NLTK BLEU有什么区别?

Ssa*_*Vut 7 nlp machine-learning nltk machine-translation bleu

Python NLTK中有BLEU得分的实现, nltk.translate.bleu_score.corpus_bleu

但我不确定它是否与mtevalv13a.pl脚本相同.

他们之间有什么区别?

alv*_*vas 7

简而言之

不,NLTK中的BLEU并不完全相同mteval-13a.perl.

但它可以变得非常接近,请参阅https://github.com/nltk/nltk/issues/1330#issuecomment-256237324

nltk.translate.corpus_bleu对应于mteval-13a.plngram的第4阶,有一些浮点差异

可以从https://github.com/nltk/nltk_data/blob/gh-pages/packages/models/wmt15_eval.zip下载比较的详细信息和使用的数据集:

import nltk
nltk.download('wmt15_eval')
Run Code Online (Sandbox Code Playgroud)

主要区别:

在此输入图像描述


在龙

mteval-13a.pl和之间有几个区别nltk.translate.corpus_bleu:

除了差异,NLTK BLEU得分包含更多功能:

最后,要验证NLTK版本的BLEU中添加的功能,可以在帐户中添加回归测试,请参阅https://github.com/nltk/nltk/blob/develop/nltk/test/unit/translate/test_bleu.py