ale*_*ejo 3 python merge concat dataframe pandas
我的问题与Pandas Merge 密切相关- 如何避免重复列但不相同.
我想连接三个数据帧中不同的列.数据框有一个列id,有些列是相同的:Ex.
DF1
id place name qty unit A
1 NY Tom 2 10 a
2 TK Ron 3 15 a
3 Lon Don 5 90 a
4 Hk Sam 4 49 a
Run Code Online (Sandbox Code Playgroud)
DF2
id place name qty unit B
1 NY Tom 2 10 b
2 TK Ron 3 15 b
3 Lon Don 5 90 b
4 Hk Sam 4 49 b
Run Code Online (Sandbox Code Playgroud)
DF3
id place name qty unit C D
1 NY Tom 2 10 c d
2 TK Ron 3 15 c d
3 Lon Don 5 90 c d
4 Hk Sam 4 49 c d
Run Code Online (Sandbox Code Playgroud)
结果:
id place name qty unit A B C D
1 NY Tom 2 10 a b c d
2 TK Ron 3 15 a b c d
3 Lon Don 5 90 a b c d
4 Hk Sam 4 49 a b c d
Run Code Online (Sandbox Code Playgroud)
列的位置,名称,数量和单位将始终是三个数据框的一部分,不同的列的名称可能会有所不同(在我的示例中为A,B,C,D).三个数据帧具有相同的行数.
我试过了:
cols_to_use = df1.columns - df2.columns
dfNew = merge(df, df2[cols_to_use], left_index=True, right_index=True, how='outer')
Run Code Online (Sandbox Code Playgroud)
问题是我获得了比预期更多的行,并且在结果数据帧中重命名了列(使用concat时).
使用reduce来自functools
from functools import reduce
reduce(lambda left,right: pd.merge(left,right), [df1,df2,df3])
Out[725]:
id place name qty unit A B C D
0 1 NY Tom 2 10 a b c d
1 2 TK Ron 3 15 a b c d
2 3 Lon Don 5 90 a b c d
3 4 Hk Sam 4 49 a b c d
Run Code Online (Sandbox Code Playgroud)