我已经尝试过PorterStemmer和Snowball,但两个都不能用于所有单词,缺少一些非常常见的单词.
我的测试词是:" 猫跑仙人掌仙人掌仙人掌社区社区 ",两者都不到一半.
也可以看看:
nlp stemming lemmatization
我有一些法语文本,我需要以某种方式处理.为此,我需要:
据我所知,NLTK中的wordnet lemmatizer只适用于英语.当我给它"voudrais"等时,我想要一些可以返回"vouloir"的东西.由于撇号,我也无法正确标记.任何指针都将非常感激.:)
python nltk lemmatization
lemmatization ×2
nlp ×1
nltk ×1
python ×1
stemming ×1