相关疑难解决方法(0)

dplyr:样本量大于种群大小

我有一个数据帧:

> class(dataset)
[1] "grouped_df" "tbl_df"     "tbl"        "data.frame"
> dim(dataset)
[1] 64480    39
Run Code Online (Sandbox Code Playgroud)

我想从中抽取50.000个样本

> dataset %>% dplyr::sample_n(50000)
Run Code Online (Sandbox Code Playgroud)

但一直给我错误

Error: Sample size (50000) greater than population size (1). Do you want replace = TRUE?
Run Code Online (Sandbox Code Playgroud)

但是,例如,这有效:

> dim(dataset[1] %>% dplyr::sample_n(50000))
[1] 50000     1
Run Code Online (Sandbox Code Playgroud)

那么为什么我的人口规模(1)- 这是否与分组有关?

r dplyr

1
推荐指数
1
解决办法
1591
查看次数

标签 统计

dplyr ×1

r ×1