Sow*_*ian 5 r machine-learning random-forest
我知道通常使用种子设置,以便我们可以重现相同的结果.但是,设置种子实际上在随机森林部分做了什么.它是否在改变任何的参数randomForest()
功能中的R像nTree
或sampSize
.
我每次都在为随机森林模型使用不同的种子,但想知道不同种子如何影响随机森林模型.
树木是从种子长出来的,森林也是如此;-) (scnr)
构建随机森林的方法有多种,但共同点是构建多棵树。为了提高单个决策树的分类准确性,随机森林中的各个树需要不同,因为您可能会拥有nTree
同一棵树。这种差异是通过在树的生成中引入随机性来实现的。随机性受到种子的影响,关于种子最重要的是使用相同的种子应该始终生成相同的结果。
随机性如何影响树的构建?有多种方法。- 为随机子集构建树。这是为森林中的每棵树绘制训练示例的子集,然后为该子集构建一棵树 - 在树中的每个决策点,随机选择决策属性。
通常这两个元素是结合在一起的。
http://link.springer.com/article/10.1023%2FA%3A1010933404324#page-1
归档时间: |
|
查看次数: |
8229 次 |
最近记录: |