Tree 包中的预测函数

Question

Tree 包中的预测函数

我在 R 中有分类树，我尝试通过以下方式进行交叉验证：

cv.tree1<-cv.tree(tree1)

Run Code Online (Sandbox Code Playgroud)

然后我试过了

tree3 = prune.tree(tree1, best=15)

Run Code Online (Sandbox Code Playgroud)

然后我试图从当前树中预测我的所有标签：

predict(tree3, data.train[1,])

Run Code Online (Sandbox Code Playgroud)

输出是：

            0         1          2          3           4           5           6          7          8
1 0.0006247397 0.8531862 0.03706789 0.02207414 0.003123698 0.008746356 0.009371095 0.00728863 0.05310287
            9
1 0.005414411

Run Code Online (Sandbox Code Playgroud)

据我了解，它给了我每个标签的概率，因为我在这里有 10 个标签 0:9 所以我试图获得最后一条语句的最大值来预测所有标签

predict.list <-matrix(0,nrow=nrow(data.train),ncol=10)
for (index in c(1:nrow(digits.train)))
{
  predict.list[index]<-predict(tree3, data.train[index,])
}

Run Code Online (Sandbox Code Playgroud)

然后我尝试获取 predict.list 中每一行的最大值，但实际上这不起作用所以我尝试查看 str(predict(tree3, data.train[index,])) 的结构我发现它是

   num [1, 1:10] 0.00656 0.00583 0.00947 0.07479 0.14813 ...
  - attr(*, "dimnames")=List of 2
  ..$ : chr "8184"
  ..$ : chr [1:10] "0" "1" "2" "3" ...

Run Code Online (Sandbox Code Playgroud)

所以问题是，我是否正确获得了最大值。每一个这样我就得到了预测，以及如何获得具有相应标签的最大值

我可以得到最大值

max(predict(tree3, digits.train[1,]))

Run Code Online (Sandbox Code Playgroud)

但我无法获得相应的标签

Answer 1

Mar*_*rco 5

该predict.tree()函数有一个名为的参数type。它的默认值是"vector"，在分类树的情况下，它将返回一个包含每个观察行的类概率的向量。您可以将其更改为"class"，它只会返回概率最高的类。在你的情况下使用

predict.list <- predict(tree3, data.train, type="class")

将返回一个长度的因子向量，nrow(data.train)每个值是为相应行预测的因子水平。

归档时间：	12 年，6 月前
查看次数：	7097 次
最近记录：	12 年，6 月前