什么是统计机器翻译的好解释?

mik*_*kel 11 language-agnostic machine-translation

我试图找到一个关于统计机器翻译如何工作的高级解释.也就是说,假设我有一个不对齐的英语,法语和德语文本语料库,我怎么能用它来将任何句子从一种语言翻译成另一种语言呢?并不是我想要自己构建谷歌翻译,但我想更详细地了解它的工作原理.

我见过谷歌搜索但没有什么好处,它要么很快需要高级数学知识来理解,要么过于笼统.维基百科关于SMT的文章似乎都是,所以它并没有多大帮助.我怀疑这是一个如此复杂的领域,如果没有所有数学,它根本无法理解.

任何人都可以给出或知道这样一个系统如何工作的一般性逐步解释,针对程序员(所以代码示例很好)但不需要数学学位来理解?或者像这样的书也会很棒.

编辑:我正在寻找的一个完美的例子是SMT相当于Peter Norvig关于拼写校正的精彩文章.这样可以很好地了解编写拼写检查程序所涉及的内容,而无需详细了解Levenshtein/soundex/smoothing算法等等.

Juk*_*nen 0

Peter Norvig 在 2007 年 Google 开发者日上的演讲《从数据理论化:避免资本错误》包含一些对统计机器翻译原理的易于理解的高级解释(大约从 21:20 开始)。