nltk.pos_tag()工作怎么样?它是否涉及任何语料库使用?我发现了一个源代码(nltk.tag- NLTK 3.0文档)
_POS_TAGGER = 'taggers/maxent_treebank_pos_tagger/english.pickle'.
Run Code Online (Sandbox Code Playgroud)
加载_POS_TAGGER会给出一个对象:
nltk.tag.sequential.ClassifierBasedPOSTagger
Run Code Online (Sandbox Code Playgroud)
,似乎没有语料库的训练.当我在名词之前使用一些串联形容词(例如快速棕色狐狸)时,标记是不正确的.我想知道我是否可以通过使用更好的标记方法或以更好的语料库进行某种程度的训练来改善结果.有什么建议?