Sam*_*Sam 13 localization machine-translation
我们正在寻找可以融入我们的本地化工作流程的开源机器翻译引擎.我们正在查看以下选项:
其中,摩西拥有最广泛的社区支持,并已被许多本地化公司和研究人员试用过.我们实际上倾向于使用基于Java的引擎,因为我们的应用程序都是Java.有没有人使用Joshua或Phrasal作为您工作流程的一部分.你能和他们分享一下你的经历吗?或者,摩西在提供的功能和易于集成方面远远超过这些.
并且,我们要求引擎支持:
我认为,在摩西邮件列表(moses-support@mit.edu)上可以更好地询问这个问题.那里有很多人使用不同类型的系统,所以你会得到一个客观的答案.除此之外,这是我的意见:
以下是您的功能请求的一些输入:
希望这可以帮助.如果您有任何疑问,请随时与我联系.
很多事情都在向前发展,所以我想提供一个关于这个主题的更新,并在那里留下前面的答案来记录进展.
特定领域培训:如果您的数据来自各种来源,并且您需要针对子域进行优化,则域适应技术会非常有用.根据我们的经验,没有一种解决方案始终表现最佳,因此您需要尝试尽可能多的方法并比较结果.Moses邮件列表上有一封邮件列出了可能的方法:http://thread.gmane.org/gmane.comp.nlp.moses.user/9742/focus=9799various.以下页面还概述了当前的研究:http://www.statmt.org/survey/Topic/DomainAdaptation
增量培训:有关IWSLT 2013的有趣话题:http://www.iwslt2013.org/downloads/Assessing_Quick_Update_Methods_of_Statistical_Translation_Models.pdf 它表明当前的增量方法(1)使您的系统脱机,因此您没有真正的"实时更新" "你的模特(2)的表现优于完全重新训练.似乎问题还没有解决.
并行化翻译过程:moses服务器在moses-cmd二进制文件上落后.因此,如果您想使用最新功能,最好从moses-cmd开始.此外,社区还没有履行其永不发布1.0版本的承诺:-).事实上,你可以在这里找到最新版本(2.1):http://www.statmt.org/moses/?n = Moses.Releases