Mad*_*dan 0 python nlp nltk wordnet
我正在研究多义词消歧项目,为此我试图从输入查询中找到多义词。我这样做的方式是:
#! /usr/bin/python
from nltk.corpus import stopwords
from nltk.corpus import wordnet as wn
stop = stopwords.words('english')
print "enter input query"
string = raw_input()
str1 = [i for i in string.split() if i not in stop]
a = list()
for w in str1:
if(len(wn.synsets(w)) > 1):
a.append(w)
Run Code Online (Sandbox Code Playgroud)
这里的列表 a 将包含多义词。但是使用这种方法几乎所有的词都会被认为是多义词。例如,如果我的输入查询是“牛奶是白色的”,那么它将 ('milk','white','colour') 存储为多义词
| 归档时间: |
|
| 查看次数: |
705 次 |
| 最近记录: |