小编mob*_*y91的帖子

R - 插入符 createDataPartition 返回比预期更多的样本

我正在尝试将 iris 数据集拆分为训练集和测试集。我createDataPartition()是这样用的:

library(caret)
createDataPartition(iris$Species, p=0.1)
# [1]  12  22  26  41  42  57  63  79  89  93 114 117 134 137 142

createDataPartition(iris$Sepal.Length, p=0.1)
# [1]   1  27  44  46  54  68  72  77  83  84  93  99 104 109 117 132 134
Run Code Online (Sandbox Code Playgroud)

我理解第一个查询。我有一个 0.1*150 个元素的向量(150 是数据集中的样本数)。但是,我应该在第二个查询中使用相同的向量,但我得到的是 17 个元素而不是 15 个元素的向量。

关于为什么我得到这些结果的任何想法?

r dataset r-caret

5
推荐指数
1
解决办法
853
查看次数

标签 统计

dataset ×1

r ×1

r-caret ×1