如何腌制多个 pandas 数据帧并在单个命令中连接所有它们

Jon*_*han 2 python dataframe pandas

Files =['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H']
fout='/PATH/df/{}/{}.F.K.df'.format('train',Files[0])
df1=pd.read_pickle(fout)
df1 = df1[df1.columns[:100]]

fout='/PATH/df/{}/{}.F.K.df'.format('train',Files[1])
df2=pd.read_pickle(fout)
df2 = df2[df2.columns[:100]]

fout='/PATH/df/{}/{}.F.K.df'.format('train',Files[2])
df3=pd.read_pickle(fout)
df3 = df3[df3.columns[:100]]

fout='/PATH/df/{}/{}.F.K.df'.format('train',Files[3])
df4=pd.read_pickle(fout)
df4 = df4[df4.columns[:100]]

fout='/PATH/df/{}/{}.F.K.df'.format('train',Files[4])
df5=pd.read_pickle(fout)
df5 = df5[df5.columns[:100]]

fout='/PATH/df/{}/{}.F.K.df'.format('train',Files[5])
df6=pd.read_pickle(fout)
df6 = df6[df6.columns[:100]]

fout='/PATH/df/{}/{}.F.K.df'.format('train',Files[6])
df7=pd.read_pickle(fout)
df7 = df7[df7.columns[:100]]

fout='/PATH/df/{}/{}.F.K.df'.format('train',Files[7])
df8=pd.read_pickle(fout)
df8 = df8[df8.columns[:100]]

df = pd.concat([df1, df2, df3, df4, df5, df6, df7, df8], axis = 1)
df = df.loc[:,~df.columns.duplicated()]
Run Code Online (Sandbox Code Playgroud)

我有以下命令,前 8 个块都是重复代码,修改很小。有没有办法我可以做到这样的事情:

[pd.read_pickle('/PATH/df/{}/{}.F.K.df'.format('train',Files[i])) for i in Files]

但这只会给我很多将被设置为同一个变量的数据帧,而且我不知道如何将其映射到 8 个不同的数据帧,然后将它们一次性连接起来。

ALo*_*llz 5

您的问题是您正在创建任意数量的变量,而您不需要这些变量。用于Files将 DataFrame 读入列表,然后将其连接起来。

df = pd.concat([pd.read_pickle('/PATH/df/{}/{}.F.K.df'.format('train', f)).iloc[:, :100] 
                for f in Files], 
               axis=1)
Run Code Online (Sandbox Code Playgroud)