什么是语音标签集的默认nltk部分?

Dea*_*ado 7 python nlp nltk

在尝试使用NLTK词性标记时,我注意到VBP在调用的输出中有很多标记nltk.pos_tag.我注意到这个标签不在Brown Corpus的语音标签集中.但它是UPenn标记集的一部分.

nltk默认使用什么标签?我在官方文档或apidocs中找不到这个.

Cha*_*pta 8

Ntlk使用PennTreebank标记集.请访问此链接http://nltk.org/api/nltk.tag.html


小智 5

它使用Penn Treebank项目中使用的POS标签.您可以在" http://www.ling.upenn.edu/courses/Fall_2003/ling001/penn_treebank_pos.html " 上看到标签列表.