小编Sha*_*ari的帖子

如何解释 scipy.stats.ttest_ind 的输出？

我有两组噪声样本 - 我想确定它们是否有实质性不同。我计划使用 2 边 t 检验来了解其均值并查看 p 值。

以前的答案（例如如何使用 numpy 计算统计数据“t-test”）建议使用ttest_indfrom scipy- 即 https://docs.scipy.org/doc/scipy/reference/ generated/scipy.stats.ttest_ind.html

但我不明白如何解释这些结果。

如果您看到示例，随机值具有相同均值的情况下的 p 值为 0.78849443369564776

>>> rvs1 = stats.norm.rvs(loc=5,scale=10,size=500)
>>> rvs2 = stats.norm.rvs(loc=5,scale=10,size=500)
>>> stats.ttest_ind(rvs1,rvs2)
(0.26833823296239279, 0.78849443369564776)

Run Code Online (Sandbox Code Playgroud)

随机值具有不同均值和标准差的情况下的 p 值为0.34744170334794122。

>>> rvs5 = stats.norm.rvs(loc=8, scale=20, size=100)
>>> stats.ttest_ind(rvs1, rvs5)
(-1.4679669854490653, 0.14263895620529152)
>>> stats.ttest_ind(rvs1, rvs5, equal_var = False)
(-0.94365973617132992, 0.34744170334794122)

Run Code Online (Sandbox Code Playgroud)

似乎我们永远不会得到低于该值的 p 值0.1并拒绝该假设，即使 rv 明显是从具有不同均值的分布中得出的。

我在这里肯定缺少一些明显的东西，但经过多次 RTFMing，我无法弄清楚它是什么......

python scipy

Sha*_*ari

lucky-day

6
推荐指数

1
解决办法

1万
查看次数