为什么我在 python 的 spearman 相关性中得到 nan

EmJ*_*EmJ 3 python scipy

scipy用来计算相关性。我计算斯皮尔曼相关性的代码如下。

from scipy import stats
sequence_1 = [1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0]
sequence_2 = [0, 0.009783728115345005, 0, 0, 0.0019759230121848587, 0.0007535430349118562, 0.0002661781514710257, 0, 0, 0.0007835762419683435]
myspearman = stats.spearmanr(sequence_1,sequence_2)
print(myspearman)
Run Code Online (Sandbox Code Playgroud)

我从代码中得到以下结果。

SpearmanrResult(correlation=nan, pvalue=nan)
Run Code Online (Sandbox Code Playgroud)

尽管本主题中有一些 SO 问题,但它们并没有专门回答我的问题。

我的问题如下。

  • 我想以某种方式为我的相关性获得一个值。从这个意义上说, 的等价值是nan多少?
  • 我的另一个问题是;有没有办法避免这种情况并在python中获得实际值?

如果需要,我很乐意提供更多详细信息。

The*_*nce 7

为什么spearmanr输出 a NaN

没有变化sequence_1,以便它的标准偏差等于0,这将导致在零除法spearmanr()功能,从而返回NaN

NaN在这种情况下的等价值是多少?

从数学上讲,当两个列表之一中的标准偏差等于 0(其中随机变量的所有实例采用完全相同的值)时,Spearman 相关系数是不确定的。我建议你研究这里的公式 以更好地理解为什么这不简单!

有没有办法避免这种情况并在 Python 中获取实际值?

由于实际值是不确定的,你得到了正确的一个值NaN。但是,您可能希望依赖其他公式来解决此类问题,例如两个变量之间的协方差 - 在这种情况下,协方差将等于 0。