使用 dplyr 编程:使用胶水语法重命名带有变量的列

Alw*_*win 4 r rename dplyr rlang tidyselect

我已经通读了《Programming with dplyr》并理解了这一点rename()select()使用了整洁的选择。我试图将其与粘合语法结合起来,以使用新的双卷曲语法(rlang v0.4.0)创建自定义函数,但是我得到了额外的引号:

library(dplyr)
#> 
#> Attaching package: 'dplyr'
#> The following objects are masked from 'package:stats':
#> 
#>     filter, lag
#> The following objects are masked from 'package:base':
#> 
#>     intersect, setdiff, setequal, union

sel_var = "homeworld"

# Attempt at using (newer) double curly syntax:
starwars %>% 
  select("{{sel_var}}_old" := {{ sel_var }})
#> # A tibble: 87 x 1
#>    `"homeworld"_old`
#>    <chr>            
#>  1 Tatooine               
#> # ... with 77 more rows

# Working, but uglier (and older) bang bang syntax:
starwars %>% 
  select(!!sym(paste0(sel_var, "_old")) := {{ sel_var }})
#> # A tibble: 87 x 1
#>    homeworld_old
#>    <chr>        
#>  1 Tatooine          
#> # ... with 77 more rows
Run Code Online (Sandbox Code Playgroud)

由reprex 包(v0.3.0)于 2021-02-16 创建

`"homeworld"_old`如何避免使用双卷曲{{ }}和粘合语法时出现额外的引号:=这在此处的summarise("mean_{{expr}}" := mean({{ expr }}), ...)函数中显示为有效。

Art*_*lov 5

粘合机制内的运算符{{在表达式级别工作,而不是字符串级别。当表达式包含字符串时,引号 ( ") 也是同一表达式的一部分,这就是您在输出中看到它们的原因。如果将字符串转换为变量名,一切都应该按预期工作:

sel_var <- as.name("homeworld")

starwars %>% 
  select("{{sel_var}}_old" := {{ sel_var }})
# # A tibble: 87 x 1
#    homeworld_old
#    <chr>        
#  1 Tatooine     
#  2 Tatooine     
# ...
Run Code Online (Sandbox Code Playgroud)

请注意summarise("mean_{{expr}}" := mean({{ expr }}), ...)您链接的示例具有相同的属性。例如,以下是该小插图中定义的函数之一:

my_summarise5 <- function(data, mean_var, sd_var) {
  data %>% 
    summarise(
      "mean_{{mean_var}}" := mean({{ mean_var }}), 
      "sd_{{sd_var}}" := mean({{ sd_var }})
    )
}
Run Code Online (Sandbox Code Playgroud)

当您将变量名称传递给函数时,一切都会按预期工作:

my_summarise5( mtcars, mpg, mpg )
#   mean_mpg   sd_mpg
# 1 20.09062 20.09062
Run Code Online (Sandbox Code Playgroud)

但是,传递字符串将包含"在输出中,如您的情况所示:

my_summarise5( mtcars, "mpg", "mpg" )
#   mean_"mpg" sd_"mpg"
# 1         NA       NA
# Warning messages:
# 1: In mean.default(~"mpg") :
#   argument is not numeric or logical: returning NA
# 2: In mean.default(~"mpg") :
#   argument is not numeric or logical: returning NA
Run Code Online (Sandbox Code Playgroud)