我在这里阅读了几个关于 h2o.predict() 和 h2o.performance() 差异的线程(如下面的链接所示)。
如何解释 h2o.predict() 结果的概率 (p0, p1)
有人能告诉我 h2o.predict() 使用哪个阈值吗?是max f1吗?如果是,它是来自训练数据、验证数据或交叉验证的阈值吗?
我尝试在测试集上使用max f1和使用验证阈值max f0point5(与训练和验证数据完全分开),但是来自 h2o.predict() 的预测类和使用阈值的类不完全匹配。
我得到的最接近的是使用max f0point5训练中的阈值并将其应用于测试集。
关于 h2o.predict 的文档并不多。另外,是否有阈值的最佳实践,即验证和培训的平均阈值等?
提前致谢!