我的问题与Pandas Merge 密切相关- 如何避免重复列但不相同.
我想连接三个数据帧中不同的列.数据框有一个列id,有些列是相同的:Ex.
DF1
id place name qty unit A
1 NY Tom 2 10 a
2 TK Ron 3 15 a
3 Lon Don 5 90 a
4 Hk Sam 4 49 a
Run Code Online (Sandbox Code Playgroud)
DF2
id place name qty unit B
1 NY Tom 2 10 b
2 TK Ron 3 15 b
3 Lon Don 5 90 b
4 Hk Sam 4 49 b
Run Code Online (Sandbox Code Playgroud)
DF3
id place name qty unit C D
1 NY …Run Code Online (Sandbox Code Playgroud) 我想在 python 中计算所有特征(所有浮点类型)和类标签(二进制、0 或 1)的相关性。此外,我想绘制数据以可视化它们按类别的分布。
这是必要的,这样我就可以找到与单个标签相关的功能并找出它们的真正重要性。请注意,我不想要成对特征相关性,并且我的分类器是二元的。
我已经尝试过以下内容(来自 stackoverflow 中的类似帖子),但这并不完全是我想要的。
df.drop("Target", axis=1).apply(lambda x: x.corr(df.Target))
Run Code Online (Sandbox Code Playgroud)
请在附图中查看其中一项功能的分布情况(来自 Weka)。
非常感谢任何反馈。