部署时 h2o MOJO 与 POJO 之间的性能差异

dee*_*wal 2 java h2o

我使用 训练了一个二元分类器模型h2o.GLM。我有大约 5-10 个功能。我想知道哪个生产速度更快?

  1. 在我的 java 代码中编码逻辑回归。
  2. 通过 h2o 使用 POJO。
  3. 使用h2o生成的MOJO。

如果我训练随机森林模型而不是 GLM,这个答案会改变吗?

我需要获得约 1 亿行的分数。我已经在分配不同观察结果的评分。

Tom*_*vic 5

对于逻辑回归,POJO 或 MOJO 都可以。更喜欢 MOJO,以获得更好的向后兼容性。

对于深度超过 6 的随机森林,一定要使用 MOJO。非常大的(例如 1 GB 的 java 代码或更多)RF 模型甚至无法编译。

MOJO 不需要编译,这非常方便,并且对于非常深的树,它们运行得更快并且具有非常一致的运行时间。