小编Sur*_*esh的帖子

python:如何在scikit学习类文件(SVM)等中使用POS(词性)功能

我想使用从nltk.pos_tag返回的词性(POS)作为sklearn分类器,如何将它们转换为vector并使用它?例如

sent ="这是POS示例"

tok = nltk.tokenize.word_tokenize(sent)pos = nltk.pos_tag(tok)print(pos)

这将返回以下[('This','DT'),('is','VBZ'),('POS','NNP'),('example','NN')]

现在我无法应用任何矢量化器(DictVectorizer,或FeatureHasher,来自scikitlearn的CountVectorizer用于分类器)

请建议

python machine-learning nltk scikit-learn

10
推荐指数
3
解决办法
6813
查看次数

标签 统计

machine-learning ×1

nltk ×1

python ×1

scikit-learn ×1