使用 Python NLTK 对英语和俄语等语言进行词干提取和词形还原

Tes*_*ate 0 python machine-learning stemming nltk

“使用 Python NLTK 对英语和俄语等语言进行词干化和词形还原”

来源: http: //text-processing.com/demo/stem/

我想使用该库通过 Python NLTK 对英语和俄语等语言进行词干提取。

您能给我建议需要使用哪个库来完成此任务吗?

Ank*_*nha 6

对于词干提取:

NLTK有广泛使用的Porter Stemmer 。

对于俄语,似乎有人使用过Snowball Stemmer

对于词形还原:

我更喜欢SpaCy 进行词形还原

对于俄语,这里有人一直在研究这个。

可以在此处找到另一个俄语文本词形还原器