在函数内部使用dplyr时出错

ari*_*888 14 r function dplyr tidyeval

我正在尝试组合一个函数,从我的原始数据框创建一个子集,然后使用dplyr的SELECT和MUTATE根据萼片/花瓣的宽度和长度的总和给出我的大/小条目的数量.

filter <- function (spp, LENGTH, WIDTH) {
  d <- subset (iris, subset=iris$Species == spp) # This part seems to work just fine
  large <- d %>%                       
    select (LENGTH, WIDTH) %>%   # This is where the problem arises.
    mutate (sum = LENGTH + WIDTH) 
  big_samples <- which(large$sum > 4)
 return (length(big_samples)) 
}
Run Code Online (Sandbox Code Playgroud)

基本上,我希望函数返回大花的数量.但是,当我运行该函数时,我得到以下错误 -

filter("virginica", "Sepal.Length", "Sepal.Width")

 Error: All select() inputs must resolve to integer column positions.
The following do not:
*  LENGTH
*  WIDTH 
Run Code Online (Sandbox Code Playgroud)

我究竟做错了什么?

jer*_*ycg 19

您遇到了NSE/SE问题,请参阅插图以获取更多信息.

简而言之,dplyr使用名称的非标准评估(NSE),并将列的名称传递给函数会破坏它,而不使用标准评估(SE)版本.

SE版本的dplyr函数以_结尾.你可以看到它select_与原始参数很好地配合.

但是,使用函数时事情会变得更复杂.我们可以使用lazyeval::interp将大多数函数参数转换为列名,请参阅下面函数中mutateto mutate_call 的转换,更一般地说,帮助:?lazyeval::interp

尝试:

filter <- function (spp, LENGTH, WIDTH) {
    d <- subset (iris, subset=iris$Species == spp) 
    large <- d %>%                       
        select_(LENGTH, WIDTH) %>%  
        mutate_(sum = lazyeval::interp(~X + Y, X = as.name(LENGTH), Y = as.name(WIDTH))) 
    big_samples <- which(large$sum > 4)
    return (length(big_samples)) 
}
Run Code Online (Sandbox Code Playgroud)


Bra*_*ell 10

更新:从dplyr 0.7.0开始,您可以使用整洁的eval来完成此任务.

有关详细信息,请参见http://dplyr.tidyverse.org/articles/programming.html.

filter_big <- function(spp, LENGTH, WIDTH) {
  LENGTH <- enquo(LENGTH)                    # Create quosure
  WIDTH  <- enquo(WIDTH)                     # Create quosure

  iris %>% 
    filter(Species == spp) %>% 
    select(!!LENGTH, !!WIDTH) %>%            # Use !! to unquote the quosure
    mutate(sum = (!!LENGTH) + (!!WIDTH)) %>% # Use !! to unquote the quosure
    filter(sum > 4) %>% 
    nrow()
}

filter_big("virginica", Sepal.Length, Sepal.Width)

> filter_big("virginica", Sepal.Length, Sepal.Width)
[1] 50
Run Code Online (Sandbox Code Playgroud)


Tun*_*ung 5

如果 quosure 和 quasiquotation 对您来说太多了,请使用.data[[ ]]or rlang {{ }}( curly curly ) 代替。有关详细信息,请参阅Hadley Wickham 的有关整洁评估的 5 分钟视频以及Hadley 的 Advanced R 书中的(可能)整洁评估部分。

library(rlang)
library(dplyr)

filter_data <- function(df, spp, LENGTH, WIDTH) {
  res <- df %>% 
    filter(Species == spp) %>% 
    select(.data[[LENGTH]], .data[[WIDTH]]) %>%        
    mutate(sum = .data[[LENGTH]] + .data[[WIDTH]]) %>% 
    filter(sum > 4) %>% 
    nrow()
  return(res)
}

filter_data(iris, "virginica", "Sepal.Length", "Sepal.Width")
#> [1] 50


filter_rlang <- function(df, spp, LENGTH, WIDTH) {
  res <- df %>% 
    filter(Species == spp) %>% 
    select({{LENGTH}}, {{WIDTH}}) %>%        
    mutate(sum = {{LENGTH}} + {{WIDTH}}) %>% 
    filter(sum > 4) %>% 
    nrow()
  return(res)
}

filter_rlang(iris, "virginica", Sepal.Length, Sepal.Width)
#> [1] 50
Run Code Online (Sandbox Code Playgroud)

由reprex 包(v0.3.0)于 2019-11-10 创建