有没有一种方法在Python 2.7中使用NLTK来获取单词而不是包含的额外格式"synset"和括号"n.01"等等?
例如,如果我这样做
wn.synsets('dog')
Run Code Online (Sandbox Code Playgroud)
我的结果如下:
[Synset('dog.n.01'), Synset('frump.n.01'), Synset('dog.n.03'), Synset('cad.n.01'), Synset('frank.n.02'), Synset('pawl.n.01'), Synset('andiron.n.01'), Synset('chase.v.01')]
Run Code Online (Sandbox Code Playgroud)
我怎样才能获得这样的列表?
dog
frump
cad
frank
pawl
andiron
chase
Run Code Online (Sandbox Code Playgroud)
有没有办法使用NLTK或我必须使用regular expressions?我可以regular expressions在python脚本中使用吗?
你好 Stackoverflow 社区
我刚刚开始摆弄 Python NLTK,并将注意力转向 Wordnet 模块。
我试图获得给定引理的 Sense Ky 并发现以下内容:
s = wn.synset('skill.n.01')
s.lemmas # >>> [Lemma('skill.n.01.skill'), ... ]
s.lemmas[0].key # >>> 'skill%1:09:01::'
Run Code Online (Sandbox Code Playgroud)
但是,此实现似乎不再受支持。
Traceback (most recent call last):
File "C:/Users/Admin/PycharmProjects/momely/placementarchitect/testbench.py", line 59, in <module>
s.lemmas[0].key
TypeError: 'method' object is not subscriptable
Run Code Online (Sandbox Code Playgroud)
我想知道是否有人能够为我指出正确的方向,即如何在给定引理或同义词集的情况下获得意义键?
任何建议将不胜感激!