相关疑难解决方法(0)

numpy corrcoef - 计算相关矩阵,同时忽略丢失的数据

我正在尝试计算几个值的相关矩阵.这些值包括一些'nan'值.我正在使用numpy.corrcoef.对于输出相关矩阵的元素(i,j),我希望使用对于变量i和变量j都存在的所有值来计算相关性.

这就是我现在拥有的:

In[20]: df_counties = pd.read_sql("SELECT Median_Age, Rpercent_2008, overall_LS, population_density FROM countyVotingSM2", db_eng)
In[21]: np.corrcoef(df_counties, rowvar = False)
Out[21]: 
array([[ 1.        ,         nan,         nan, -0.10998411],
       [        nan,         nan,         nan,         nan],
       [        nan,         nan,         nan,         nan],
       [-0.10998411,         nan,         nan,  1.        ]])
Run Code Online (Sandbox Code Playgroud)

太多的南瓜:(

python numpy correlation pandas

15
推荐指数
2
解决办法
2万
查看次数

标签 统计

correlation ×1

numpy ×1

pandas ×1

python ×1