小编ben*_*ier的帖子

R的randomForest包中缺少值错误

我正在使用randomForest包来使用标准流程对二进制结果变量进行分类.我首先必须强制更改所有变量以确保它们是数字,然后用于na.roughfix处理缺失值:

data <- read.csv("data.csv")
data <- lapply(data, as.numeric)
data <- na.roughfix(data) 
Run Code Online (Sandbox Code Playgroud)

然后我运行模型:

model <- randomForest(as.factor(outcome) ~ V1 + V2...+ VN, 
         data=data, 
         importance=TRUE,
         ntree=500)
Run Code Online (Sandbox Code Playgroud)

我收到以下错误:

na.fail.default中的错误(list(as.factor(outcome)= c(2L,2L,1L,:对象中缺少值)

na.roughfix估算应该已经解决了这个问题(我之前已经开始工作,这里的研究表明它应该工作),对吗?有什么建议?

r machine-learning missing-data random-forest

5
推荐指数
1
解决办法
1069
查看次数

重新排列R中多个矩阵的形状

这是一个双管R问题.我有一个数据集文件夹(在.csv中),需要在分析之前进行更改.每个数据集都是1X10矩阵,如:

1 2 3 4 5 6 7 8 9 10
Run Code Online (Sandbox Code Playgroud)

并需要将其转换为以下5X5矩阵在对角线上插入1s:

1
1 1 
2 3 1
4 5 6 1
7 8 9 10 1
Run Code Online (Sandbox Code Playgroud)

如何在文件夹中的多个文件上完成此转换?

csv r dataset social-networking import-from-csv

4
推荐指数
1
解决办法
107
查看次数