如何计算R quosure中的变量数？

Question

如何计算R quosure中的变量数？

Jef*_*ard 4 r dplyr tidyverse tidyeval rlang

假设我有一个函数,它使用非标准评估(NSE)从该数据框中获取数据框和不同数量的变量.是否有更快/更直接的方法来计算提供的变量数量而不是select()这些变量并计算列数？

# Works but seems non-ideal
nvar <- function(df, vars) {
  vars_en <- rlang::enquo(vars)
  df_sub <- dplyr::select(df, !!vars_en)
  ncol(df_sub)
}
nvar(mtcars, mpg:hp)
#> 4

Run Code Online (Sandbox Code Playgroud)

Answer 1

CPa*_*Pak 6

非常怀疑(我意识到这可能会收到downvotes) - 我认为最明智的选择是简单地从data.frame的colnames中选择 - 使用 tidyselect::vars_select

nvar1 <- function(df, vars) {
  vars_en <- rlang::enquo(vars)
  ans <- vars_select(names(df), !! vars_en)
  length(ans)
}

Run Code Online (Sandbox Code Playgroud)

但即便如此也要慢 select(df) %>% ncol

library(microbenchmark)
library(nycflights13)
library(tidyselect)

nvar <- function(df, vars) {
  vars_en <- rlang::enquo(vars)
  df_sub <- dplyr::select(df, !!vars_en)
  ncol(df_sub)
}

identical(nvar(nycflights13::flights, day:sched_arr_time), nvar1(nycflights13::flights, day:sched_arr_time))
# TRUE

microbenchmark(nvar(nycflights13::flights, day:sched_arr_time), nvar1(nycflights13::flights, day:sched_arr_time), unit='relative', times=100L)

# Unit: relative
                                             # expr      min       lq    mean   median       uq       max neval
  # nvar(nycflights13::flights, day:sched_arr_time) 1.000000 1.000000 1.00000 1.000000 1.000000 1.0000000   100
 # nvar1(nycflights13::flights, day:sched_arr_time) 1.685793 1.680676 1.60114 1.688626 1.660196 0.9878235   100

Run Code Online (Sandbox Code Playgroud)

归档时间：	7 年，7 月前
查看次数：	116 次
最近记录：	7 年，6 月前