我有大量的csv文件,我想读入R.所有csvs中的列标题是相同的.起初我以为我需要根据文件名列表创建一个循环,但在搜索之后我发现了一种更快的方法.这将正确读入并组合所有csvs(据我所知).
filenames <- list.files(path = ".", pattern = NULL, all.files = FALSE, full.names = FALSE, recursive = FALSE, ignore.case = FALSE)
library(plyr)
import.list <- llply(filenames, read.csv)
combined <- do.call("rbind", import.list)
Run Code Online (Sandbox Code Playgroud)
唯一的问题是我想知道特定行数据来自哪个csv.我想要一个标有"source"的列,其中包含特定行来自的csv的名称.所以例如,如果csv被称为Chicago_IL.csv,当数据进入R时,行看起来像这样:
> City State Market etc Source
> Burbank IL Western etc Chicago_IL
Run Code Online (Sandbox Code Playgroud) r ×1