加入/合并两个 Pandas 数据框并使用列作为多索引

1nf*_*rn0 4 python merge multi-index pandas

按日期,我​​有两个带有 KPI 的数据框。我想将它们组合起来并使用多索引,以便可以轻松地将两个 df 的每个 KPI 与另一个进行比较。

像这样:

连接数据帧和交换多索引

我试图将每个 KPI 提取到一个系列中,相应地重命名该系列(df1、df2),然后使用 pd.concat 的 keys 参数将它们连接起来,但它似乎不起作用。

任何帮助将不胜感激。

Sco*_*ton 10

让我们用pd.concatkeys参数,swaplevel以及sort_index

df1 = pd.DataFrame({'A':['A0','A1','A2'],'B':['B0','B1','B2'],'C':['C0','C1','C2']},index=pd.date_range('2017-01-01',periods=3, freq='M'))
df2 = pd.DataFrame({'A':['A3','A4','A5'],'B':['B3','B4','B5'],'C':['C3','C4','C5']},index=pd.date_range('2017-01-01',periods=3, freq='M'))

pd.concat([df1,df2],axis=1,keys=['df1','df2']).swaplevel(0,1,axis=1).sort_index(axis=1)
Run Code Online (Sandbox Code Playgroud)

输出:

             A       B       C    
           df1 df2 df1 df2 df1 df2
2017-01-31  A0  A3  B0  B3  C0  C3
2017-02-28  A1  A4  B1  B4  C1  C4
2017-03-31  A2  A5  B2  B5  C2  C5
Run Code Online (Sandbox Code Playgroud)