在嵌套数据框列上使用 mutate_at() 生成多个非嵌套列

Question

在嵌套数据框列上使用 mutate_at() 生成多个非嵌套列

G_T*_*G_T 5 r dplyr tidyr purrr tidyverse

我正在试验dplyr,tidyr和purrr。我有这样的数据：

library(tidyverse)

set.seed(123)
df <- data_frame(X1 = rep(LETTERS[1:4], 6),
                 X2 = sort(rep(1:6, 4)),
                 ref = sample(1:50, 24),
                 sampl1 = sample(1:50, 24),
                 var2 = sample(1:50, 24),
                 meas3 = sample(1:50, 24))

Run Code Online (Sandbox Code Playgroud)

现在dplyr很棒，因为我可以mutate_at()同时操作多个列。例如：

df <- df %>% 
  mutate_at(vars(-one_of(c("X1", "X2", "ref"))), funs(first = . - ref)) %>% 
  mutate_at(vars(contains("first")),  funs(second = . *2 ))

Run Code Online (Sandbox Code Playgroud)

并tidyr允许我将数据的子集嵌套为单个列中的子表：

df <- df %>% nest(-X1)

Run Code Online (Sandbox Code Playgroud)

多亏了purrr我可以总结这些子表，同时保留嵌套列中的原始数据：

df %>% mutate(mean = map_dbl(data, ~ mean(.x$meas3_first_second)))

Run Code Online (Sandbox Code Playgroud)

如何使用purrr和mutate_at()生成多个汇总列（采用每个嵌套子表中不同（但不是全部）列的方法）？

在这个例子中，我想取其中包含“second”一词的每一列的平均值。我曾希望这可能会产生一个新的嵌套列，然后我可以，unnest()但它不起作用。

df %>% mutate(mean = map(data, ~ mutate_at(vars(contains("second")),
                                           funs(mean_comp_exp = mean(.)))))

Run Code Online (Sandbox Code Playgroud)

我怎样才能做到这一点？

Answer 1

G_T*_*G_T 2

@aosmith 的评论是正确且有帮助的此外，我意识到我需要使用summarise_at()而不是mutate_at()像这样：

df %>% 
    mutate(mean = map(data, ~ summarise_at(.x, vars(contains("second")),
                                               funs(mean_comp_exp = mean(.) )))) %>%
    unnest(mean)

Run Code Online (Sandbox Code Playgroud)

归档时间：	8 年，3 月前
查看次数：	564 次
最近记录：	8 年，3 月前