我正在使用randomForest包来使用标准流程对二进制结果变量进行分类.我首先必须强制更改所有变量以确保它们是数字,然后用于na.roughfix处理缺失值:
data <- read.csv("data.csv")
data <- lapply(data, as.numeric)
data <- na.roughfix(data)
Run Code Online (Sandbox Code Playgroud)
然后我运行模型:
model <- randomForest(as.factor(outcome) ~ V1 + V2...+ VN,
data=data,
importance=TRUE,
ntree=500)
Run Code Online (Sandbox Code Playgroud)
我收到以下错误:
na.fail.default中的错误(list(as.factor(outcome)= c(2L,2L,1L,:对象中缺少值)
na.roughfix估算应该已经解决了这个问题(我之前已经开始工作,这里的研究表明它应该工作),对吗?有什么建议?
这是一个双管R问题.我有一个数据集文件夹(在.csv中),需要在分析之前进行更改.每个数据集都是1X10矩阵,如:
1 2 3 4 5 6 7 8 9 10
Run Code Online (Sandbox Code Playgroud)
并需要将其转换为以下5X5矩阵在对角线上插入1s:
1
1 1
2 3 1
4 5 6 1
7 8 9 10 1
Run Code Online (Sandbox Code Playgroud)
如何在文件夹中的多个文件上完成此转换?