BLEU分数的变化

Jür*_* K. 5 evaluation metrics translation machine-learning bleu

我对机器翻译的蓝分计算有一些疑问.我意识到他们可能有不同的BLEU指标.我发现代码报告了BLEU的五个值,即BLEU-1,BLEU-2,BLEU-3,BLEU-4以及最后的BLEU,它们似乎是前四个BLEU的指数平均值.我还不清楚它们之间的区别是什么.你有什么想法?谢谢

Ps起初我认为这个问题更多的是理论内容,并将其发布在meta stackexange上.主持人已关闭并将其评论为stackoverflow类型问题.所以请不要再惩罚我.=)

Ima*_*deh 7

来源:http://www.statmt.org/book/slides/08-evaluation.pdf

我没有听说过BLEU-1和BLEU-2,但我想这意味着在BLEU得分公式中1克,2克,3克和4克,我的意思是precision[i] = BLEU-i你问题中的公式:
在此输入图像描述


小智 6

实际上,BLEU-n 不仅仅使用 n-gram 分数。它通过 n-gram 分数计算 1-gram 分数,并赋予它们相同的权重来计算最终分数。有关详细信息,请参阅此链接中的“累积 N-Gram 分数”部分。