我有兴趣在python中部署机器学习模型,因此可以通过对服务器的请求进行预测.
我将创建一个Cloudera集群,并利用Spark开发模型,使用库pyspark.我想知道如何保存模型以便在服务器上使用它.
我已经看到不同的算法具有.save函数(就像在本文中如何在Apache Spark中保存和加载MLLib模型一样),但是因为服务器将在没有Spark的不同机器中而不在Cloudera集群中,我不知道是否可以使用他们的.load和.predict函数.
可以通过使用pyspark库函数进行预测而不使用Spark吗?或者我是否必须进行任何转换才能保存模型并在其他地方使用它?