如何将Spark ML Lib模型保存/导出到PMML?

tri*_*ta2 6 deployment modeling hadoop machine-learning apache-spark

我想使用Spark ML Lib训练模型,然后能够以平台无关的格式导出模型.基本上我想要分离模型的创建和消费方式.

我想要这种解耦的原因是我可以在其他项目中部署模型.例如:

  • 使用该模型在单独的独立程序中执行预测,该程序不依赖于Spark进行评估.
  • 将模型与OpenScoring等现有项目一起使用,并提供可以使用该模型的API.
  • 将现有模型加载回Spark以进行高吞吐量预测.

有没有人用Spark ML Lib做过这样的事情?

use*_*561 4

Spark 1.4 版本现已支持此功能。请参阅最新文档。并非所有模型都可用(请参阅支持(请参阅JIRA 问题 SPARK-4587)。

HTH