我想使用从nltk.pos_tag返回的词性(POS)作为sklearn分类器,如何将它们转换为vector并使用它?例如
sent ="这是POS示例"
tok = nltk.tokenize.word_tokenize(sent)pos = nltk.pos_tag(tok)print(pos)
这将返回以下[('This','DT'),('is','VBZ'),('POS','NNP'),('example','NN')]
现在我无法应用任何矢量化器(DictVectorizer,或FeatureHasher,来自scikitlearn的CountVectorizer用于分类器)
请建议