相关疑难解决方法(0)

python中的wordnet词形还原和pos标记

我想在python中使用wordnet lemmatizer并且我已经知道默认的pos标签是NOUN并且它没有为动词输出正确的引理,除非明确指定了pos标签作为VERB.

我的问题是,准确执行上述词形还原的最佳镜头是什么?

我做了pos标记使用nltk.pos_tag,我迷失了将树库pos标签集成到wordnet兼容的pos标签.请帮忙

from nltk.stem.wordnet import WordNetLemmatizer
lmtzr = WordNetLemmatizer()
tagged = nltk.pos_tag(tokens)
Run Code Online (Sandbox Code Playgroud)

我得到NN,JJ,VB,RB的输出标签.如何将这些更改为wordnet兼容标签?

我还需要nltk.pos_tag()使用带标记的语料库进行训练,还是可以直接在我的数据上进行评估?

python nltk wordnet lemmatization

53
推荐指数
5
解决办法
5万
查看次数

标签 统计

lemmatization ×1

nltk ×1

python ×1

wordnet ×1