我正在通过NLTK在Brown Corpus上使用Wordnet Lemmatizer(以确定其中的名词是否以其单数形式或复数形式使用更多).
即 from nltk.stem.wordnet import WordNetLemmatizer
l = WordnetLemmatizer()
我注意到即使是最简单的查询,例如下面的查询也需要相当长的时间(至少一两秒钟).
l("cats")
据推测,这是因为网络连接必须要WORDNET进行每个查询?..
我不知道是否有一种方法仍然使用WORDNET Lemmatizer但它执行得更快?例如,我可以帮助将Wordnet下载到我的机器上吗?还是其他任何建议?
我想弄清楚如果WORDNET Lemmatizer可以进行得更快,而不是尝试不同的lemmatizer,因为我发现它的工作原理最好在其他像波特和兰开斯特.