Chr*_*sen 5 python statistics p-value goodness-of-fit hypothesis-test
我想找到最适合某些数据的分布。这通常是某种测量数据,例如力或扭矩。
理想情况下,我想运行具有多个分布的 Anderson-Darling,并选择具有最高 p 值的分布。这类似于Minitab中的“拟合优度”检验。我无法找到计算 p 值的 Anderson-Darling 的 python 实现。
我尝试过scipy, stats.anderson()但它只返回 AD 统计量和具有相应显着性水平的临界值列表,而不是 p 值本身。
我也研究过statsmodels,但似乎只支持正态分布。我需要比较几种分布(正态分布、威布尔分布、对数正态分布等)的拟合度。
python 中是否有返回 p 值并支持非正态分布的 Anderson-Darling 实现?
我只会根据拟合优度统计量而不是 p 值对分布进行排名。我们可以使用 Anderson-Darling、Kolmogorov-Smirnov 或类似的统计量作为距离度量来对不同分布的拟合程度进行排名。
背景:
Anderson-Darling 或 Kolmogorov-Smirnov 的 p 值取决于是否估计参数。在这两种情况下,分布都不是标准分布。
在某些情况下,我们可以对列表值进行列表或使用函数逼近。这是当未估计参数并且分布是没有形状参数的简单位置尺度族时的情况。
对于具有形状参数的分布,计算 p 值所需的检验统计量的分布取决于参数。也就是说,我们必须为每组参数计算不同的分布或表格 p 值,这是不可能的。在这些情况下获取 p 值的唯一解决方案是通过引导程序或模拟特定参数的检验统计量。
技术条件是检验统计量是否渐近关键,即检验统计量的渐近分布与具体参数无关。
对分箱数据使用卡方检验需要较少的假设,即使在估计参数时我们也可以计算它。(严格来说,只有当参数是通过 MLE 使用分箱数据估计时才成立。)