R中的randomForest:是否有可能计算逐案置信区间?

use*_*417 4 r confidence-interval random-forest

R package randomForest报告森林中每棵树的平均误差.但是,我需要对数据中的每个案例充满信心.由于randomForest通过对单个树的预测求平均来计算案例预测,我想也应该可以计算一个案例标准误差,从而计算置信区间.这可以使用输出randomForest对象完成(如果是这样的话:怎么做?)或者我是否需要深入研究源代码?

jor*_*ran 6

无需深入挖掘源代码.您只需阅读文档即可.?predict.randomForest声明其中一个参数被称为predict.all:

predict.all 是否应保留所有树木的预测?

因此,设置TRUE为每个树保留每个案例的预测,然后您可以使用它来计算每个案例的标准误差.

我最近了解了Stefan Wager,Trevor Hastie和Brad Efron 的这篇论文,论文更严格地研究了随机森林(和其他袋装预测器)产生的预测标准误差的概念.