这是我的第一篇文章,请耐心等待.以下是我的数据的一小部分样本.我的实际数据集有超过4,000个个人ID,每个ID可以分配给它的一到两百个单独的美元金额.
ID Dollars
001 17000
001 18000
001 23000
002 64000
002 31000
003 96000
003 164000
003 76000
Run Code Online (Sandbox Code Playgroud)
我最初尝试做的事情可以用一个例子来解释.我想为每个ID生成五个随机样本,替换.每个样本的大小为5或5个随机抽样的美元值.我的最终结果将有20,000个单独的样本(5个样本,每4000个ID,每个ID包含5个随机选择的ID金额).我这样做是为了将每个样本中的美元分布与具有相同ID的其他样本进行比较.
截至目前,我正试图使用下面引用的代码获得这样的答案.我还应该指出,当我运行这个脚本时,我收到一个错误,我的'结果必须是全原子'.我不确定是否需要添加额外的步骤或什么.
x <- function(func)
{
func<-(lapply(1:5, function(i)
sample(data$Dollars, size=5, replace=TRUE)))
}
grouped.samples<-ddply(data,.variables="ID",.fun=x)
Run Code Online (Sandbox Code Playgroud)
如果我提出的问题不明确,我会提前感到抱歉; 我很难说出我遇到的问题.
在此先感谢您的帮助