如何使用Bootstrap方法计算95%置信区间

Question

如何使用Bootstrap方法计算95%置信区间

我正在尝试使用python中的bootstrap方法计算平均值的置信区间.假设我有一个包含100个条目的向量a,我的目标是使用bootstrap计算这100个值的平均值及其95%置信区间.到目前为止,我已经设法使用np.random.choice函数从我的向量重新采样1000次.然后对于具有100个条目的每个引导向量,我计算平均值.所以现在我有1000个bootstrap平均值和来自我的初始向量的单个样本均值,但我不知道如何从这里开始.我如何使用这些平均值来找到初始向量的平均值的置信区间？我在python中比较新,这是我第一次遇到bootstrap的方法,所以任何帮助都会非常感激.

Answer 1

Hor*_*man 5

您可以对1000个数组的数组进行排序,并使用第50个和第950个元素作为90%引导置信区间.

你的1000套方法基本上是均值估计量分布的样本(均值的抽样分布).因此,您可以在此处执行的分发中对样本执行的任何操作.

Answer 2

小智 5

我有一个简单的统计解决方案：置信区间基于标准误差。您案例中的标准误差是您的 1000 个引导程序平均值的标准偏差。假设您的参数（均值）的抽样分布呈正态分布，这应该由中心极限定理的属性保证，只需将所需置信区间的等效 z 分数乘以标准偏差即可。所以：

下边界 = 你的 bootstrap 平均值 - 1.96 * std。开发你的引导意味着

上边界 = 你的 bootstrap 平均值 + 1.96 * std。开发你的引导意味着

正态分布中 95% 的案例与平均值相差 1.96 个标准差

希望这可以帮助

归档时间：	9 年前
查看次数：	9571 次
最近记录：	8 年，7 月前