小编LRG*_*LRG的帖子

在插入符中:创建多个不同大小的分区以进行测试/培训/验证

我正在尝试获取一个数据集并将其划分为3个部分:训练:60%,测试:20%,验证:20%。

part1 <- createDataPartition(fullDataSet$classe, p=0.8, list=FALSE)
validation <- fullDataSet[-part1,]
workingSet <- fullDataSet[part1,]
Run Code Online (Sandbox Code Playgroud)

当我做同样的事情再次分区时:

inTrain <- createDataPartition(workingSet$classe, p=.75, list=FALSE)
Run Code Online (Sandbox Code Playgroud)

我得到错误:

Error in sort.list(y) : 'x' must be atomic for 'sort.list'
Have you called 'sort' on a list?
Run Code Online (Sandbox Code Playgroud)

有没有一种方法要么a)创建3个不同大小的分区,要么b)像我尝试做的那样嵌套一个分区?我考虑过c)使用sample()代替,但这是针对讲师仅使用createDataPartition的类,并且我们必须显示代码。有人在这里有什么建议吗?

r data-partitioning r-caret

4
推荐指数
1
解决办法
4163
查看次数

标签 统计

data-partitioning ×1

r ×1

r-caret ×1