我有几个txt文件。每个文件都有以逗号分隔的数据列。每个文件都有自己的文件名。
到目前为止,我已使用以下代码将这些文件组合到一个大数据框中:
files = list.files()
data2=lapply(files, read.table, header=FALSE, sep=",")
data_rbind <- do.call("rbind", data2)
colnames(data_rbind)[c(1,2,3)]<-c("name", "sex", "amount")
Run Code Online (Sandbox Code Playgroud)
返回:
名字性别数量
安娜F 24567
艾玛F 23210
伊莎贝尔F 31212
阿曼达F 22631
我想在数据的每一行旁边添加第4列,以指定数据最初来自的文件的名称。
因此,例如,如果第一个文件“ example1.txt”包含以下内容:
安娜,女,24567
艾玛(Emma),楼23210
Isabelle,F,31212
第二个文件“ example2.txt”包含以下内容:
阿曼达,F,22631
莎拉(F)41355
凯蒂,F,2387
我想得到以下内容:
姓名性别年份
安娜F 24567 example1.txt
艾玛F 23210 example1.txt
阿曼达F 22631 example2.txt
萨拉F 41355 example2.txt
凯蒂F 2387 example2.txt
这可能吗?