从多个文件创建pandas数据框

Abh*_*bhi 13 python pandas

我正在尝试创建一个大熊猫DataFrame,它适用于单个文件.如果我需要为具有相同数据结构的多个文件构建它.因此,我有一个文件名列表,而不是单个文件名,我想从中创建DataFrame.

不知道DataFrame在pandas中附加到当前的方式是什么,或者有没有办法让pandas将文件列表吸入到DataFrame.

zac*_*ach 27

pandas concat命令是你的朋友.假设您拥有目录targetdir中的所有文件.您可以:

  1. 列出文件列表
  2. 将它们作为pandas数据帧加载
  3. 并将它们连接在一起

`

import os
import pandas as pd

#list the files
filelist = os.listdir(targetdir) 
#read them into pandas
df_list = [pd.read_table(file) for file in filelist]
#concatenate them together
big_df = pd.concat(df_list)
Run Code Online (Sandbox Code Playgroud)

  • 在我的用例中,我需要执行`pd.concat(df_list,ignore_index = True,axis = 1)`,因为每个csv文件都代表一列 (2认同)