如何引用 dplyr mutate 中的其他列名称?

use*_*485 5 r dplyr across

我想跨使用 dplyr mutate,并引用另一个用于所有 mutate 函数的静态列。

df <- data.frame(baseline = c(1,2,3), day1 = c(NA,2,2), day2 = c(2,3,4), day3= c(5,4,6))
Run Code Online (Sandbox Code Playgroud)

我想为每天超过基线的变化创建一个新列“fc”。我想我可能需要“sym”和 !! 的组合 围绕基线使其发挥作用,但还没有弄清楚。

df %>% mutate(fc = mutate(across(starts_with('day')), ./baseline))
Run Code Online (Sandbox Code Playgroud)

给出错误

警告消息:在 format.data.frame(if (omit) x[seq_len(n0), , drop = FALSE] else x, : 损坏的数据帧:列将被截断或用 NA 填充

我在每天的列中都有一些缺失值,因此编辑了上面的代码。当输入中存在 NA 时,如何将给出的 NA 合并到输出中而不是失败?

Duc*_*uck 4

尝试这个:

library(dplyr)
#Code
df2 <- df %>% mutate(across(day1:day3,.fns = list(fc = ~ ./baseline)))
Run Code Online (Sandbox Code Playgroud)

输出:

  baseline day1 day2 day3   day1_fc  day2_fc day3_fc
1        1    2    2    5 2.0000000 2.000000       5
2        2    2    3    4 1.0000000 1.500000       2
3        3    2    4    6 0.6666667 1.333333       2
Run Code Online (Sandbox Code Playgroud)

或者保留相同的变量:

#Code 2
df <- df %>% mutate(across(day1:day3,~ ./baseline))
Run Code Online (Sandbox Code Playgroud)

输出:

  baseline      day1     day2 day3
1        1 2.0000000 2.000000    5
2        2 1.0000000 1.500000    2
3        3 0.6666667 1.333333    2
Run Code Online (Sandbox Code Playgroud)

添加新数据后,您将得到:

#Code 3
df2 <- df %>% mutate(across(day1:day3,.fns = list(fc = ~ ./baseline)))
Run Code Online (Sandbox Code Playgroud)

输出:

  baseline day1 day2 day3   day1_fc  day2_fc day3_fc
1        1   NA    2    5        NA 2.000000       5
2        2    2    3    4 1.0000000 1.500000       2
3        3    2    4    6 0.6666667 1.333333       2
Run Code Online (Sandbox Code Playgroud)