我想知道如何在R中绘制这些多个自举曲线.我的代码就像
dat2 <- read.delim("bone.data", sep ="\t", header= TRUE)
y <- dat2[,4]
x <- dat2[,2]
plot(x,y,xlab="age",ylab="BMD",col=ifelse(dat2[,3]=="female","red","blue"))
Run Code Online (Sandbox Code Playgroud)
多个Bootstrap曲线如本书左下角的图8.2所示. ESL

名为Bone Mineral Density的数据可以从这个网站获得: 数据
文件的直接链接是:here
您可以使用smooth.spline和绘制样条曲线lines:
plot.spline = function(x, y, ...) {
s = smooth.spline(x, y, cv=TRUE)
lines(predict(s), ...)
}
Run Code Online (Sandbox Code Playgroud)
因此,为了执行引导,根据本书中的说明,您可以从替换的数据中对随机行plot.spline进行采样,并调用重新采样的数据:
bootstrap.curves = function(dat, nboot, ...) {
for (i in 1:nboot) {
subdata = dat[sample(NROW(dat), replace=TRUE), ]
plot.spline(subdata$age, subdata$spnbmd, ...)
}
}
Run Code Online (Sandbox Code Playgroud)
因此,您可以使用此功能为男性和女性运行单独的图:
bootstrap.curves(dat2[dat2$gender == "female", ], 10, col="red")
bootstrap.curves(dat2[dat2$gender == "male", ], 10, col="blue")
Run Code Online (Sandbox Code Playgroud)
最终结果:

注意:此代码将产生许多警告(而不是错误),如下所示:
1: In smooth.spline(x, y, cv = TRUE) :
crossvalidation with non-unique 'x' values seems doubtful
Run Code Online (Sandbox Code Playgroud)
这是因为引导程序重新取样.smooth.spline使用交叉验证来确定给出样条曲线的自由度数,但它不希望使用重复x值(因为实际上总是会有自举重新采样).你可以通过选择你自己的自由度来解决这个问题,但这可能就此而言很好.