mal*_*cho 5 python nlp nltk wordnet part-of-speech
我的问题与WordNet Interface 有关。
>>> wn.synsets('cat')
[Synset('cat.n.01'), Synset('guy.n.01'), Synset('cat.n.03'),
Synset('kat.n.01'), Synset('cat-o'-nine-tails.n.01'),
Synset('caterpillar.n.02'), Synset('big_cat.n.01'),
Synset('computerized_tomography.n.01'), Synset('cat.v.01'),
Synset('vomit.v.01')]
>>>
Run Code Online (Sandbox Code Playgroud)
我找不到答案是什么目的n和下面number的cat.n.01或caterpillar.n.02。
根据NLTK 文档,<lemma>.<pos>.<number>Synset 字符串由以下部分组成:
<lemma>是词的形态词干<pos>是模块属性 ADJ、ADJ_SAT、ADV、NOUN 或 VERB 之一<number>是有义数,从 0 开始计数
因此, the<pos>是词性。根据wordnet 手册页,词性字符具有以下含义:
n NOUN
v VERB
a ADJECTIVE
s ADJECTIVE SATELLITE
r ADVERB
Run Code Online (Sandbox Code Playgroud)
本<number>是用来消除歧义词的含义。
| 归档时间: |
|
| 查看次数: |
2155 次 |
| 最近记录: |