Pos使用NLTK标记德语文本

Ach*_*him 5 python nltk pos-tagger

我想使用NLTK来标记德国文本。我在网上找到了一些参考资料,但大多数参考资料已过时。一些参考,例如“ EUROPARL”同义词库,但看起来只有“ EUROPARL_raw”仍然可用。而且那个没有POS标签。我还发现了一些有关TIGER语料库用法的参考,但最新版本似乎是我无法使用NLTK解析的格式。

我知道一些非NTLT的替代方法,但我更喜欢使用NLTK。有人可以提供一个基于德国语料库的POS标记的简单示例吗?

Big*_*ome 3

我无法找到用于 NLTK 的标记语料库。如果您需要预先标记的语料库,那么 NLTK 可能会不走运。对于这个问题有一个开放的问题票,但没有任何进展(阅读 Negra Corpus 文件

您可以使用NLTK TrainerNegra Corpus来标记您自己的语料库。它需要德语语法知识,但不需要编码。请参阅NLTK-Trainer的演示。