HHH*_*HHH 5 mahout apache-spark
我想对大数据集进行多标签文本分类,并且似乎大数据机器学习工具(例如Apache Mahout或Spark MLLib)目前不支持该分类。我想知道是否有人对大数据集进行过多标签分类?有没有计划在不久的将来在Mahout或Spark中集成多标签分类?
本文阐述了您将从多输出预测中获得的好处的本质......即:
\n\n根据您的需求 - 我建议尝试针对您当前的问题将采样缩小到较小的组,然后如果性能与您正在寻找的不匹配,则围绕数据集中的定制组创建多个模型。
\n\n我自己仍然面临着这个挑战(自从你发帖以来已经四年了......)。
\n\n以下是我在尝试解决此问题时收集的有用文章列表:
\n\n\n| 归档时间: |
|
| 查看次数: |
495 次 |
| 最近记录: |