我目前有这样一句话:
text = "This is a car."
Run Code Online (Sandbox Code Playgroud)
然后我使用一个tokeniser,然后像这样干它:
ps = PorterStemmer()
text = word_tokenize(text)
stemmed_words = []
for w in words:
stemmed_words.append(ps.stem(w))
Run Code Online (Sandbox Code Playgroud)
但是,我现在希望使用NLTK的lemmainser来代替.要使用它,我需要给它一个像这样的单词的部分(在循环内):
lemmatizer = WordNetLemmatizer()
word = lemmatizer.lemmatize(w, pos=pos)
Run Code Online (Sandbox Code Playgroud)
但是,我不确定如何得到pos论证.我知道我可以使用它来获得演讲的一部分,但不接受作为参数:
pos = nltk.pos_tag(text)
Run Code Online (Sandbox Code Playgroud)