小编Yim*_*mes的帖子

重新取样,按组替换

这是我的第一篇文章,请耐心等待.以下是我的数据的一小部分样本.我的实际数据集有超过4,000个个人ID,每个ID可以分配给它的一到两百个单独的美元金额.

ID   Dollars
001  17000
001  18000
001  23000
002  64000
002  31000
003  96000
003  164000
003  76000
Run Code Online (Sandbox Code Playgroud)

我最初尝试做的事情可以用一个例子来解释.我想为每个ID生成五个随机样本,替换.每个样本的大小为5或5个随机抽样的美元值.我的最终结果将有20,000个单独的样本(5个样本,每4000个ID,每个ID包含5个随机选择的ID金额).我这样做是为了将每个样本中的美元分布与具有相同ID的其他样本进行比较.

截至目前,我正试图使用​​下面引用的代码获得这样的答案.我还应该指出,当我运行这个脚本时,我收到一个错误,我的'结果必须是全原子'.我不确定是否需要添加额外的步骤或什么.

x <- function(func)
     {
      func<-(lapply(1:5, function(i)
        sample(data$Dollars, size=5, replace=TRUE)))
     }
     grouped.samples<-ddply(data,.variables="ID",.fun=x)
Run Code Online (Sandbox Code Playgroud)

如果我提出的问题不明确,我会提前感到抱歉; 我很难说出我遇到的问题.

在此先感谢您的帮助

r random-sample sample-data

3
推荐指数
1
解决办法
1243
查看次数

标签 统计

r ×1

random-sample ×1

sample-data ×1