randomForest的重要性仅包含MeanDecreaseGini

N. *_*cA. 2 r data-mining random-forest

我有两个脚本都在R中生成随机森林,据我所知,它们具有相同的输入,尽管我的问题表明情况并非如此。其中一个返回包含以下内容的重要性表

row.names importance.blue importance.red importance.MeanDecreaseAccuracy importance.MeanDecreaseGini

其他重要性表仅包含

row.names   MeanDecreaseGini
Run Code Online (Sandbox Code Playgroud)

这两个森林之间的区别是什么?更重要的是,鉴于我认为相同的输入,是什么引起了差异?

(脚本太大了,无法在此处粘贴,但是两个脚本都试图根据一系列连续变量来预测一个因素)

Ste*_*fan 5

randomForest的帮助页面告诉我们,重要性(当用于分类时)是一个nclass + 2列的矩阵。前nclass列是针对特定类别的度量,计算为准确性的平均下降。nclass + 1st列是所有类的准确性平均下降。最后一栏是基尼系数的平均下降。如果重要性=假,则最后一个度量仍作为向量返回。

因此,在我看来,您一次调用了randomForest,其重要性为TRUE,而重要性为FALSE。