我正在尝试使用python中的bootstrap方法计算平均值的置信区间.假设我有一个包含100个条目的向量a,我的目标是使用bootstrap计算这100个值的平均值及其95%置信区间.到目前为止,我已经设法使用np.random.choice函数从我的向量重新采样1000次.然后对于具有100个条目的每个引导向量,我计算平均值.所以现在我有1000个bootstrap平均值和来自我的初始向量的单个样本均值,但我不知道如何从这里开始.我如何使用这些平均值来找到初始向量的平均值的置信区间?我在python中比较新,这是我第一次遇到bootstrap的方法,所以任何帮助都会非常感激.
您可以对1000个数组的数组进行排序,并使用第50个和第950个元素作为90%引导置信区间.
你的1000套方法基本上是均值估计量分布的样本(均值的抽样分布).因此,您可以在此处执行的分发中对样本执行的任何操作.
小智 5
我有一个简单的统计解决方案:置信区间基于标准误差。您案例中的标准误差是您的 1000 个引导程序平均值的标准偏差。假设您的参数(均值)的抽样分布呈正态分布,这应该由中心极限定理的属性保证,只需将所需置信区间的等效 z 分数乘以标准偏差即可。所以:
下边界 = 你的 bootstrap 平均值 - 1.96 * std。开发 你的引导意味着
上边界 = 你的 bootstrap 平均值 + 1.96 * std。开发 你的引导意味着
正态分布中 95% 的案例与平均值相差 1.96 个标准差
希望这可以帮助
| 归档时间: |
|
| 查看次数: |
9571 次 |
| 最近记录: |