按列名索引拆分数据框

nou*_*use 5 r

这是早期问题的变体.

df <- data.frame(matrix(rnorm(9*9), ncol=9))
names(df) <- c("c_1", "d_1", "e_1", "a_p", "b_p", "c_p", "1_o1", "2_o1", "3_o1")
Run Code Online (Sandbox Code Playgroud)

我想通过下划线"_"后面的column.names中给出的索引来拆分数据帧.(索引可以是不同长度的任何字符/数字;这些只是随机的例子).

indx <- gsub(".*_", "", names(df))
Run Code Online (Sandbox Code Playgroud)

并相应地命名结果数据帧,最后我希望得到三个数据帧,称为:

  • df_1
  • df_p
  • df_o1

谢谢!

akr*_*run 4

在这里,您可以通过 拆分列名称,使用和indx获取列表中的数据子集,使用 和 设置列表元素的名称,如果需要将它们作为单独的数据集,则可以使用(不建议这样做,因为大多数操作都可以在列表中完成,稍后如果需要,可以使用with保存。 lapply[setNameslist2envwrite.tablelapply

 list2env(
     setNames(
       lapply(split(colnames(df), indx), function(x) df[x]),
                paste('df', sort(unique(indx)), sep="_")), 
                                              envir=.GlobalEnv)


head(df_1,2)
#      c_1        d_1        e_1
#1  1.0085829 -0.7219199  0.3502958
#2 -0.9069805 -0.7043354 -1.1974415


head(df_o1,2)
#     1_o1      2_o1       3_o1
#1 0.7924930  0.434396  1.7388130
#2 0.9202404 -2.079311 -0.6567794

head(df_p,2)
#      a_p       b_p        c_p
#1 -0.12392272 -1.183582  0.8176486
#2  0.06330595 -0.659597 -0.6350215
Run Code Online (Sandbox Code Playgroud)

或者使用Map. 这类似于上面的方法,即。拆分列名并indx使用[来提取列,其余如上。

list2env(setNames(Map(`[` , 
       list(df), split(colnames(df), indx)),
          paste('df',unique(sort(indx)), sep="_")), envir=.GlobalEnv)
Run Code Online (Sandbox Code Playgroud)

更新

你可以做:

 indx1 <- factor(indx, levels=unique(indx))
 split(colnames(df), indx1)
Run Code Online (Sandbox Code Playgroud)