如何在Apache Spark中进行多标签分类

HHH*_*HHH 5 mahout apache-spark

我想对大数据集进行多标签文本分类,并且似乎大数据机器学习工具(例如Apache Mahout或Spark MLLib)目前不支持该分类。我想知道是否有人对大数据集进行过多标签分类?有没有计划在不久的将来在Mahout或Spark中集成多标签分类?

sha*_*dev 0

本文阐述了您将从多输出预测获得的好处的本质......即:

\n\n
    \n
  1. 在进行预测时能够考虑多个独立的输入参数,而不必不断更新您在给定预测中尝试进行的每个第 n 个索引预测的指标。
  2. \n
  3. 计算速度提高。
  4. \n
\n\n

根据您的需求 - 我建议尝试针对您当前的问题将采样缩小到较小的组,然后如果性能与您正在寻找的不匹配,则围绕数据集中的定制组创建多个模型。

\n\n

我自己仍然面临着这个挑战(自从你发帖以来已经四年了......)。

\n\n

以下是我在尝试解决此问题时收集的有用文章列表:

\n\n\n