使用purrr映射dplyr :: select

ohn*_*lus 6 r dplyr purrr

我有一个数据框架,其中有一堆嵌套的数据框架,我想将dplyr :: select应用于每个嵌套的数据框架。这是一个例子

 library(tidyverse)

 mtcars %>%
 group_by(cyl) %>%
 nest %>%
 mutate(data2 = ~map(data, dplyr::select(.,-mpg)))
Run Code Online (Sandbox Code Playgroud)

我认为这将导致一个包含三列的数据框。cyl:柱面数,data:嵌套数据,data2:与数据相同,除了每个元素没有mpg列。

而是R崩溃:

 *** caught segfault ***
address 0x7ffc1e445000, cause 'memory not mapped'

Traceback:
 1: .Call(`_dplyr_mutate_impl`, df, dots)
 2: mutate_impl(.data, dots)
 3: mutate.tbl_df(., data2 = ~map(data, dplyr::select(., -mpg)))
 4: mutate(., data2 = ~map(data, dplyr::select(., -mpg)))
 5: function_list[[k]](value)
 6: withVisible(function_list[[k]](value))
 7: freduce(value, `_function_list`)
 8: `_fseq`(`_lhs`)
 9: eval(quote(`_fseq`(`_lhs`)), env, env)
10: eval(quote(`_fseq`(`_lhs`)), env, env)
11: withVisible(eval(quote(`_fseq`(`_lhs`)), env, env))
12: mtcars %>% group_by(cyl) %>% nest %>% mutate(data2 = ~map(data,     dplyr::select(., -mpg)))

Possible actions:
1: abort (with core dump, if enabled)
2: normal R exit
3: exit R without saving workspace
4: exit R saving workspace
Run Code Online (Sandbox Code Playgroud)

我意识到,如果在嵌套之前应用选择操作,便可以获得所需的列,但这与我的实际问题不太相似。有人可以告诉我我在做什么错吗?感谢您的任何建议。

Psi*_*dom 7

你需要~mapselect; 或使用评论作为@Russ;~当函数(在本例中purrr::map)接受公式作为参数时使用:

mtcars %>%
    group_by(cyl) %>%
    nest %>%
    mutate(data2 = map(data, ~ select(., -mpg)))

# A tibble: 3 x 3
#    cyl data               data2            
#  <dbl> <list>             <list>           
#1     6 <tibble [7 × 10]>  <tibble [7 × 9]> 
#2     4 <tibble [11 × 10]> <tibble [11 × 9]>
#3     8 <tibble [14 × 10]> <tibble [14 × 9]>
Run Code Online (Sandbox Code Playgroud)