小编Sur*_*esh的帖子

我想使用从nltk.pos_tag返回的词性(POS)作为sklearn分类器,如何将它们转换为vector并使用它？例如

sent ="这是POS示例"

tok = nltk.tokenize.word_tokenize(sent)pos = nltk.pos_tag(tok)print(pos)

这将返回以下[('This','DT'),('is','VBZ'),('POS','NNP'),('example','NN')]

现在我无法应用任何矢量化器(DictVectorizer,或FeatureHasher,来自scikitlearn的CountVectorizer用于分类器)

请建议

10
推荐指数

3
解决办法

6813
查看次数

小编Sur_esh的帖子