通常,在自然语言处理中,我们希望得到一个标记的引理。
例如,我们可以使用 wordnet lemmatization 将“eaten”映射到“eat”。
python中是否有任何工具可以将引理反转为某种形式?
例如,我们将 'go' 映射到 'gone' 给定目标形式 'eaten'。
PS:有人提到我们必须存储这样的映射。 如何在 Python 中取消词干?
我有两个清单:一,用户的利益; 第二,关于一本书的关键词.我想根据他给定的兴趣列表向用户推荐这本书.我使用的是SequenceMatcher类Python库的difflib匹配像"游戏","游戏","游戏","玩家"等类似的词语的ratio功能给我之间的数[0,1],说明了2串如何相似.但我陷入了一个例子,我计算了"循环"和"射击"之间的相似性.它出来了0.6667.
for interest in self.interests:
for keyword in keywords:
s = SequenceMatcher(None,interest,keyword)
match_freq = s.ratio()
if match_freq >= self.limit:
#print interest, keyword, match_freq
final_score += 1
break
Run Code Online (Sandbox Code Playgroud)
有没有其他方法可以在Python中执行这种匹配?