hss*_*say 5 python r machine-learning pmml
有关持久和重新使用经过培训的机器学习模型的任何建议/最佳实践?我正在用Python或R开发模型.然后这些模型必须在生产工作流程中用于评分(其中R不可用).例如,可能存在用R训练的逻辑回归模型.现在需要针对该模型对新观察进行评分.评分引擎必须快速且可扩展.我想到了以下
PMML(http://en.wikipedia.org/wiki/Predictive_Model_Markup_Language).很容易将R中开发的大多数模型转换为pmml.但是,我找不到PMML模型的有用评分引擎.例如,有augustus(https://code.google.com/p/augustus/),但它仅实现了3-4个型号.
使用Python中的pickle对模型进行序列化,并使用Python编写使用者.
关于正确方法的任何想法/建议?
Scikit-learn是该领域成熟的库,它使用pickle 来持久化模型。我猜您正在编写自己的函数来训练模型,但是查看已建立的库可以告诉您最佳实践。
另一方面,JSON 可以从多种语言中读取。这是它的主要优点。如果您计划从另一种语言提供模型结果,并且您的模型是相当简单的 Python 对象,那么将它们序列化为 JSON 应该非常容易。
| 归档时间: |
|
| 查看次数: |
1701 次 |
| 最近记录: |