Die*_*oIE 7 python correlation pandas
我试图获取数据帧的单个列和其余数字列之间的相关性,但我陷入困境。
我正在尝试这样做:
corr = IM['imdb_score'].corr(IM)
Run Code Online (Sandbox Code Playgroud)
但我得到了错误
操作数无法与形状一起广播
我认为这是因为我试图找到向量(我的imdb_score列)与多列数据帧之间的相关性。
如何解决这个问题?
它使用的最有效的方法corrwith。
例子:
df.corrwith(df['A'])
Run Code Online (Sandbox Code Playgroud)
示例数据的设置:
import numpy as np
import pandas as pd
df = pd.DataFrame(np.random.randint(10, size=(5, 5)), columns=list('ABCDE'))
# A B C D E
# 0 7 2 0 0 0
# 1 4 4 1 7 2
# 2 6 2 0 6 6
# 3 9 8 0 2 1
# 4 6 0 9 7 7
Run Code Online (Sandbox Code Playgroud)
输出:
A 1.000000
B 0.526317
C -0.209734
D -0.720400
E -0.326986
dtype: float64
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
6124 次 |
| 最近记录: |