WordNet - n 和数字代表什么?

mal*_*cho 5 python nlp nltk wordnet part-of-speech

我的问题与WordNet Interface 有关

   >>> wn.synsets('cat')
       [Synset('cat.n.01'), Synset('guy.n.01'), Synset('cat.n.03'),
        Synset('kat.n.01'), Synset('cat-o'-nine-tails.n.01'), 
        Synset('caterpillar.n.02'), Synset('big_cat.n.01'), 
        Synset('computerized_tomography.n.01'), Synset('cat.v.01'), 
        Synset('vomit.v.01')]
    >>> 
Run Code Online (Sandbox Code Playgroud)

我找不到答案是什么目的n和下面numbercat.n.01caterpillar.n.02

unu*_*tbu 6

根据NLTK 文档<lemma>.<pos>.<number>Synset 字符串由以下部分组成:

  • <lemma> 是词的形态词干
  • <pos> 是模块属性 ADJ、ADJ_SAT、ADV、NOUN 或 VERB 之一
  • <number> 是有义数,从 0 开始计数

因此, the<pos>是词性。根据wordnet 手册页,词性字符具有以下含义:

n    NOUN
v    VERB
a    ADJECTIVE
s    ADJECTIVE SATELLITE
r    ADVERB 
Run Code Online (Sandbox Code Playgroud)

<number>是用来消除歧义词的含义。