如何在R中设置C5.0包的成本矩阵?

bou*_*eli 4 r decision-tree

我在网上搜索了很多内容,但没有找到有关R中C5.0功能的'成本'参数的任何有用描述.从C5.0 R手册中,它只是说"与成本相关的矩阵"可能的错误.矩阵应该有C列和行,其中C是类级别的数量".它没有告诉我是否是模型的预测结果.

有人可以帮忙吗?

COO*_*ash 7

以下是C5.0(版本0.1.0-15)帮助页面中的引用:

成本矩阵应该由CxC表示,其中C是类的数量.对角元素被忽略.列应对应于真正的类,行是预测的类.例如,如果C = 3,类别为红色,蓝色和绿色(按此顺序),矩阵的(2,3)元素中的值为5将表示将绿色样本预测为蓝色的成本是五倍通常的价值(一).

按照帮助页面中的示例,这将是一个成本矩阵:

cost.matrix <- matrix(c(
  NA, 2, 4,
  3, NA, 5,
  7, 1, NA

), 3, 3, byrow=TRUE)

rownames(cost.matrix) <- colnames(cost.matrix) <- c("Red", "Blue", "Green")

cost.matrix

      Red Blue Green
Red    NA    2     4
Blue    3   NA     5
Green   7    1    NA
Run Code Online (Sandbox Code Playgroud)

这意味着以下内容:

  • 将红色样本预测为蓝色是通常值的值的3倍(一)
  • 将红色样本预测为绿色是通常值的7倍
  • 将蓝色样本预测为红色是使用值的2倍
  • 将蓝色样本预测为绿色是用户值的1倍
  • 将绿色样本预测为红色是使用值的4倍
  • 将绿色样本预测为蓝色是通常值的5倍