使用 PySpark 将模型导出为 PMML

Sam*_*raR 2 apache-spark pyspark apache-spark-ml apache-spark-mllib

是否可以使用 PySpark 将模型导出为 PMML?我知道这可以使用 Spark。但是我在 PySpark 文档中没有找到任何参考。那么这是否意味着如果我想这样做,我需要使用某些第三方 python PMML 库编写自定义代码?

use*_*924 5

可以使用JPMML-SparkML库将 Apache Spark 管道导出到 PMML 。此外,该库由JPMML-SparkML-Package项目以“Spark Package”的形式提供给最终用户。

示例 PySpark 代码:

from jpmml_sparkml import toPMMLBytes
pmmlBytes = toPMMLBytes(sc, df, pipelineModel)
print(pmmlBytes)
Run Code Online (Sandbox Code Playgroud)