我有一个数据帧:
> class(dataset)
[1] "grouped_df" "tbl_df" "tbl" "data.frame"
> dim(dataset)
[1] 64480 39
Run Code Online (Sandbox Code Playgroud)
我想从中抽取50.000个样本
> dataset %>% dplyr::sample_n(50000)
Run Code Online (Sandbox Code Playgroud)
但一直给我错误
Error: Sample size (50000) greater than population size (1). Do you want replace = TRUE?
Run Code Online (Sandbox Code Playgroud)
但是,例如,这有效:
> dim(dataset[1] %>% dplyr::sample_n(50000))
[1] 50000 1
Run Code Online (Sandbox Code Playgroud)
那么为什么我的人口规模(1)- 这是否与分组有关?