Mul*_*one 3 statistics analysis pearson correlation
我在区间[0,1]中有2个45个值的系列.第一个系列是人工生成的标准,第二个系列是计算机生成的(完整系列在这里http://www.copypastecode.com/74844/).第一个系列逐渐排序.
0.909090909 0.216196598
0.909090909 0.111282099
0.9 0.021432587
0.9 0.033901106
...
0.1 0.003099256
0 0.001084533
0 0.008882249
0 0.006501463
Run Code Online (Sandbox Code Playgroud)
现在我要评估的是第二个系列中订单保留的程度,因为第一个系列是单调的.该Pearson相关是0.454763067,但我认为我们之间的关系不是线性的,所以这个值是难以解释.
一种自然的方法是使用Spearman等级相关,在这种情况下是0.670556181.我注意到随机值,当Pearson非常接近0时,Spearman等级相关性上升到0.5,所以0.67的值似乎非常低.
您将使用什么来评估这两个系列之间的顺序相似性?
我想评估订单保留的程度
由于它是您关注的顺序(排名),因此Spearman排名相关性是更有意义的指标.
我注意到随机值[...] Spearman等级相关性达到0.5
你如何生成这些随机值?我刚刚使用生成的一些随机数进行了一个简单的实验numpy,我没有看到:
In [1]: import numpy as np
In [2]: import scipy.stats
In [3]: x = np.random.randn(1000)
In [4]: y = np.random.randn(1000)
In [5]: print scipy.stats.spearmanr(x, y)
(-0.013847401847401847, 0.66184551507218536)
Run Code Online (Sandbox Code Playgroud)
第一个数字(-0.01)是秩相关系数; 第二个数字(0.66)是相关的p值.
| 归档时间: |
|
| 查看次数: |
5970 次 |
| 最近记录: |