我希望用Spark实现,它是一种具有多输出的多标签分类算法,但是令我惊讶的是,Spark Machine Learning库中没有任何模型可以做到这一点。
如何使用Spark做到这一点?
否则,Scikit Learn Logistic回归在输入/输出中支持多标签分类,但不支持用于训练的大量数据。
要查看scikit学习中的代码,请单击以下链接:https : //gist.github.com/mkbouaziz/5bdb463c99ba9da317a1495d4635d0fc
scikit-learn apache-spark pyspark
apache-spark ×1
pyspark ×1
scikit-learn ×1