使用doc2vec表示的scikit-learn分类

Mik*_*ert 2 machine-learning scikit-learn text-classification doc2vec

我想使用doc2vec表示和scikit-learn模型对文本文档进行分类.

我的问题是我迷失了如何开始.有人可以解释通常使用doc2vec与scikit-learn采取的一般步骤吗?

gre*_*ess 7

这里有一个很棒的教程,可以使用scikit-learn + doc2vec进行二进制分类.简而言之:

  • 利用gensim训练/加载doc2vec模型.
  • 输入文本将转换为浮动的固定维度向量(与嵌入相同的维度).这些是实际的输入功能.
  • 现在随意使用任何分类器scikit-learn.