使用命名列表和 `:=` 在 R `data.table` 中设置多列

dla*_*ggy 7 r data.table

用于:=创建新列是我最喜欢的 data.table 功能之一。我知道有两种使用它一次添加多个列的方法。这是一个简单的例子

dt <- data.table("widths" = seq(2, 10, 2), "heights" = 8:4)
dt
   widths heights
1:      2       8
2:      4       7
3:      6       6
4:      8       5
5:     10       4
Run Code Online (Sandbox Code Playgroud)

假设我想添加两列,一列用于面积,另一列用于周长。第一种方法是调用,例如

new_cols <- c("areas", "perimeters")

my_fun <- function(x, y){
  areas <- x * y
  perimeters <- 2*(x + y)
  return(list(areas = areas, perimeters = perimeters))
}

dt[ , (new_cols) := my_fun(widths, heights)]
dt
   widths heights areas perimeters
1:      2       8   16        20
2:      4       7   28        22
3:      6       6   36        24
4:      8       5   40        26
5:     10       4   40        28
Run Code Online (Sandbox Code Playgroud)

:=同样,我们可以使用如下的函数形式:

dt[ , `:=`("areas" = widths * heights, "perimeters" = 2*(widths + heights))]
Run Code Online (Sandbox Code Playgroud)

这两种方法都需要提前输入新列的名称。您可以手动输入它们,可以在创建列之前将它们保存在对象中,或者可以在其左侧使用一个函数来:=生成名称。:=我不知道的是一种在一次调用中获取名称和输出的方法。

有没有办法做到这一点?这是我希望做的事情的一个例子:

dt[ , (new_cols) := NULL] # delete the previously added area and perimeter cols.
dt[ , `:=`(my_fun(widths, heights))]
dt
   widths heights areas perimeters
1:      2       8   16        20
2:      4       7   28        22
3:      6       6   36        24
4:      8       5   40        26
5:     10       4   40        28
Run Code Online (Sandbox Code Playgroud)

理想情况下,有一种方法可以让:=seemy_fun()返回名称,然后将它们用作新列的名称。我知道上面的内容会产生错误,但我想知道是否有一种简单的方法来获得所需的功能,因为这对于有很多列或列名称取决于函数输入的较大问题很有用。

编辑:我正在寻找的关键是一种通过引用分配这些列的方法,即使用:=或 set(),并且我还想将输出的类维护为data.table.

chi*_*n12 1

评论太长了。不漂亮:

dt[, {
    a <- my_fun(widths, heights)   
    for (x in names(a))
        set(dt, j=x, value=a[[x]])
}]
Run Code Online (Sandbox Code Playgroud)

dt或者如果该函数是由您创建的,您可以传递给该函数吗?