在尝试使用NLTK词性标记时,我注意到VBP在调用的输出中有很多标记nltk.pos_tag.我注意到这个标签不在Brown Corpus的语音标签集中.但它是UPenn标记集的一部分.
nltk默认使用什么标签?我在官方文档或apidocs中找不到这个.
小智 5
它使用Penn Treebank项目中使用的POS标签.您可以在" http://www.ling.upenn.edu/courses/Fall_2003/ling001/penn_treebank_pos.html " 上看到标签列表.