使用Pandas合并具有不同维度的多个数据框

Question

使用Pandas合并具有不同维度的多个数据框

我有以下数据框架(实际上它们超过3个).

import pandas as pd
df1 = pd.DataFrame({'head1': ['foo', 'bix', 'bar'],'val': [11, 22, 32]})
df2 = pd.DataFrame({'head2': ['foo', 'xoo', 'bar','qux'],'val': [1, 2, 3,10]})
df3 = pd.DataFrame({'head3': ['xoo', 'bar',],'val': [20, 100]})
# Note that the value in column 'head' is always unique

Run Code Online (Sandbox Code Playgroud)

我想要做的是根据head列合并它们.每当head一个数据帧中不存在a的值时,我们就会为它分配NA.

最后它看起来像这样:

         head1   head2  head3
 -------------------------------
 foo     11      1       NA
 bix     22      NA      NA
 bar     32      3      100
 xoo     NA      2      20
 qux     NA      10     NA

Run Code Online (Sandbox Code Playgroud)

如何使用熊猫实现这一目标？

Answer 1

Ffi*_*ydd 6

您可以使用pandas.concat选择axis=1连接多个DataFrame.

但请注意,我首先设置了索引,df1, df2, df3以使用变量(foo,bar等)而不是默认的整数.

import pandas as pd

df1 = pd.DataFrame({'head1': ['foo', 'bix', 'bar'],'val': [11, 22, 32]})
df2 = pd.DataFrame({'head2': ['foo', 'xoo', 'bar','qux'],'val': [1, 2, 3,10]})
df3 = pd.DataFrame({'head3': ['xoo', 'bar',],'val': [20, 100]})

df1 = df1.set_index('head1')
df2 = df2.set_index('head2')
df3 = df3.set_index('head3')


df = pd.concat([df1, df2, df3], axis = 1)

columns = ['head1', 'head2', 'head3']
df.columns = columns

print(df)

     head1  head2  head3
bar     32      3    100
bix     22    NaN    NaN
foo     11      1    NaN
qux    NaN     10    NaN
xoo    NaN      2     20

Run Code Online (Sandbox Code Playgroud)

归档时间：	11 年，9 月前
查看次数：	2553 次
最近记录：	11 年，9 月前