过去,在处理数据框并希望将单列作为向量时,我会这样使用magrittr::extract2():
mtcars %>%
mutate(wt_to_hp = wt/hp) %>%
extract2('wt_to_hp')
Run Code Online (Sandbox Code Playgroud)
但我已经看到了,dplyr::pull()并且purrr::pluck()也存在做很多相同的工作:从数据帧返回单个向量,与[[.
假设我总是为我从事的任何项目加载所有 3 个库,那么这 3 个函数中的每一个的优点和用例是什么?或者更具体地说,它们有什么区别?
MrF*_*ick 10
什么时候“应该”使用函数实际上是个人喜好问题。哪个功能最清楚地表达了您的意图。它们之间存在差异。例如,pluck当您想要进行多次提取时效果更好。从帮助文件:
accessor(x[[1]])$foo
# is the same as
pluck(x, 1, accessor, "foo")
Run Code Online (Sandbox Code Playgroud)
因此,虽然它可用于仅提取一列,但当您具有更深的嵌套结构或想要使用访问器函数进行组合时,它会很有用。
该pull函数旨在与dplyr函数的结果融合。它可以使用包中其他函数的任何方式来获取列的名称。例如,它将与!!样式扩展一起使用,而 sayextract2不会。
irispull <- function(x) {
iris %>% pull(!!enquo(x))
}
irispull(Sepal.Length)
Run Code Online (Sandbox Code Playgroud)
并且extract2只不过是基本函数的“更具可读性”的包装器[[。事实上,它被定义为.Primitive("[[")它期望列名作为字符或列索引和整数。