如何在Giza ++中进行训练和测试?

m-A*_*tan 31 nlp machine-learning giza++

在人工智能方法中,我们有两个阶段的训练.这些阶段是数据和测试.

在培训阶段,我们给出了一个庞大的数据量的系统和我们通常用更小的数据量测试.然后我们评估输出.

现在问题是这个培训可以通过嵌入在GIZA ++中的内置功能来完成,或者我们应该为此编写一个单独的应用程序?

如果我们应该编写一个单独的应用程序,任何人都可以建议已经编写的应用程序帮助我吗?还是手册?注意:我想要一个对齐程序而不是统计机器翻译

我更喜欢用Giza ++训练,所以我可以测试未观察到的数据.

提前致谢.

小智 1

这应该是使用Moses训练基线 mt 系统的良好起点。
通常,GIZA++ 用于对平行语料库进行单词对齐。
您还需要一些其他工具,例如 IRSTLM、SRILM 或 KenLM 来进行语言模型估计。