ARPA文件的Python接口

Bek*_*eka 9 python nlp n-gram language-model

我正在寻找一个Python的接口来加载ARPA文件(回退语言模型),并利用它们来评估一些文字,如得到它的日志概率,困惑等.

我不需要在Python中生成ARPA文件,只是用它来进行查询.

有人推荐套餐吗?我已经看过kenlmswig-srilm,但是第一个在Windows中很难设置,第二个似乎不再维护了.

Bek*_*eka 4

我发现了一个名为pynlpl的正在开发的不错的包,它完全满足我的需要,并且依赖项很少(libxml2 就足够了),并且它为 ARPA 文件提供了纯 pythonic 实现