Python Pandas pandas 相关性 一列与全部

Die*_*oIE 7 python correlation pandas

我试图获取数据帧的单个列和其余数字列之间的相关性,但我陷入困境。

我正在尝试这样做:

corr = IM['imdb_score'].corr(IM)
Run Code Online (Sandbox Code Playgroud)

但我得到了错误

操作数无法与形状一起广播

我认为这是因为我试图找到向量(我的imdb_score列)与多列数据帧之间的相关性。

如何解决这个问题?

moz*_*way 6

它使用的最有效的方法corrwith

例子:

df.corrwith(df['A'])
Run Code Online (Sandbox Code Playgroud)

示例数据的设置:

import numpy as np
import pandas as pd
df = pd.DataFrame(np.random.randint(10, size=(5, 5)), columns=list('ABCDE'))

#    A  B  C  D  E
# 0  7  2  0  0  0
# 1  4  4  1  7  2
# 2  6  2  0  6  6
# 3  9  8  0  2  1
# 4  6  0  9  7  7
Run Code Online (Sandbox Code Playgroud)

输出:

A    1.000000
B    0.526317
C   -0.209734
D   -0.720400
E   -0.326986
dtype: float64
Run Code Online (Sandbox Code Playgroud)