部署时 h2o MOJO 与 POJO 之间的性能差异

Question

我使用训练了一个二元分类器模型h2o.GLM。我有大约 5-10 个功能。我想知道哪个生产速度更快？

如果我训练随机森林模型而不是 GLM，这个答案会改变吗？

我需要获得约 1 亿行的分数。我已经在分配不同观察结果的评分。

Answer 1

对于逻辑回归，POJO 或 MOJO 都可以。更喜欢 MOJO，以获得更好的向后兼容性。

对于深度超过 6 的随机森林，一定要使用 MOJO。非常大的（例如 1 GB 的 java 代码或更多）RF 模型甚至无法编译。

MOJO 不需要编译，这非常方便，并且对于非常深的树，它们运行得更快并且具有非常一致的运行时间。