插入:使用随机森林并包括交叉验证

asa*_*tor 2 random-forest cross-validation r-caret

我使用插入包来训练随机森林,包括重复的交叉验证.我想知道是否使用了Breiman的原始RF中的OOB,或者是否将其替换为交叉验证.如果它被替换,我是否具有与Breiman 2001中描述的相同的优点,如通过减少输入数据之间的相关性来提高准确度?由于OOB是在更换时绘制的,而CV是在没有替换的情况下绘制的,两个程序是否可比?什么是错误率的OOB估计(基于CV)?

树木是如何生长的?是否使用CART?

由于这是我的第一个主题,如果您需要更多详细信息,请告诉我.提前谢谢了.

top*_*epo 5

这里有很多基本问题,你可以通过阅读有关机器学习或预测建模的书来获得更好的服务.这可能就是为什么你没有得到太多回应.

对于caret您也应该咨询包装网站,其中一些问题得到解答.

以下是一些注意事项:

  • RF的CV和OOB估计有些不同.这篇文章可能有助于解释如何.对于此应用程序,在构建模型时计算来自随机森林的OOB速率,而CV使用在计算随机森林模型之后预测的保持样本.
  • 原始随机森林模型(此处使用)使用未修剪的CART树.同样,这是在许多教科书和论文中.

马克斯