我有两组噪声样本 - 我想确定它们是否有实质性不同。我计划使用 2 边 t 检验来了解其均值并查看 p 值。
以前的答案(例如如何使用 numpy 计算统计数据“t-test”)建议使用ttest_indfrom scipy- 即
https://docs.scipy.org/doc/scipy/reference/ generated/scipy.stats.ttest_ind.html
但我不明白如何解释这些结果。
如果您看到示例,随机值具有相同均值的情况下的 p 值为 0.78849443369564776
>>> rvs1 = stats.norm.rvs(loc=5,scale=10,size=500)
>>> rvs2 = stats.norm.rvs(loc=5,scale=10,size=500)
>>> stats.ttest_ind(rvs1,rvs2)
(0.26833823296239279, 0.78849443369564776)
Run Code Online (Sandbox Code Playgroud)
随机值具有不同均值和标准差的情况下的 p 值为0.34744170334794122。
>>> rvs5 = stats.norm.rvs(loc=8, scale=20, size=100)
>>> stats.ttest_ind(rvs1, rvs5)
(-1.4679669854490653, 0.14263895620529152)
>>> stats.ttest_ind(rvs1, rvs5, equal_var = False)
(-0.94365973617132992, 0.34744170334794122)
Run Code Online (Sandbox Code Playgroud)
似乎我们永远不会得到低于该值的 p 值0.1并拒绝该假设,即使 rv 明显是从具有不同均值的分布中得出的。
我在这里肯定缺少一些明显的东西,但经过多次 RTFMing,我无法弄清楚它是什么......