多标签文档分类

use*_*350 7 java machine-learning text-mining document-classification

我有一个数据库,我根据以下三个字段存储数据:id,text,{labels}.请注意,每个文本都已分配给多个label\tag\class.我想构建一个模型(weka\rapidminer\mahout),它可以推荐\将一堆标签\标签\类分类到给定的文本.

我听说过SVM和朴素贝叶斯分类器,但不确定它们是否支持多标签分类.任何指导我正确方向的东西都非常受欢迎!

mig*_*rez 1

SVM 本质上是一个二元分类器,但有许多替代方案可以使其应用于多标签环境,基本上是通过组合 SVM 的多个二元实例。

一些示例位于SVM维基百科文章的多类部分。我不确定你是否对细节感兴趣,但它们都包含在 Weka 和 Rapidminer 中。例如,SMO分类器是将 SVM 应用于多标签问题的变体之一。

朴素贝叶斯可以直接应用于多标签环境。