如何将字符串中的表达式传递给 dplyr 0.7.2 中的动词

use*_*077 6 r dplyr rlang

我正在尝试实施我在网上找到的建议,但我已经走到了我想去的地方。

这是一个可重现的示例:

library(tidyverse)
library(dplyr)
library(rlang)

data(mtcars)

filter_expr = "am == 1"

mutate_expr = "gear_carb = gear*carb"

select_expr = "mpg , cyl"

mtcars %>% filter_(filter_expr) %>% mutate_(mutate_expr) %>% select_(select_expr)
Run Code Online (Sandbox Code Playgroud)

过滤器表达式工作正常。

发生变异表达的作品很好,但新的变量名称gear_carb =齿轮*碳水化合物,而不是预期的gear_carb

最后,select表达式返回一个异常。

Art*_*lov 6

正如评论中提到的,dplyr 动词的下划线版本现在已被弃用。正确的做法是使用quasiquotation

要解决您的问题select,您只需修改select_expr以包含多个表达式:

## I renamed your variables to *_str because they are, well, strings.
filter_str <- "am == 1"
mutate_str <- "gear_carb = gear*carb"
select_str <- "mpg; cyl"                # Note the ;
Run Code Online (Sandbox Code Playgroud)

使用rlang::parse_expr这些字符串转换为不计算表达式:

## Notice the plural parse_exprs, which parses a list of expressions
filter_expr <- rlang::parse_expr( filter_str )
mutate_expr <- rlang::parse_expr( mutate_str )
select_expr <- rlang::parse_exprs( select_str )
Run Code Online (Sandbox Code Playgroud)

鉴于未评估的表达式,我们现在可以将它们传递给dplyr动词。写入filter( filter_expr )将不起作用,因为filter将查找filter_expr在您的数据框中命名的列。相反,我们想要访问存储 filter_expr. 为此,我们使用!!运算符让dplyr动词知道参数应该扩展到它的内容(这是我们感兴趣的未评估表达式):

mtcars %>% filter( !!filter_expr )
#     mpg cyl  disp  hp drat    wt  qsec vs am gear carb
# 1  21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4
# 2  21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4
# 3  22.8   4 108.0  93 3.85 2.320 18.61  1  1    4    1
# 4  32.4   4  78.7  66 4.08 2.200 19.47  1  1    4    1

mtcars %>% mutate( !!mutate_expr )
#     mpg cyl  disp  hp drat    wt  qsec vs am gear carb gear_carb = gear * carb
# 1  21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4                      16
# 2  21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4                      16
# 3  22.8   4 108.0  93 3.85 2.320 18.61  1  1    4    1                       4
# 4  21.4   6 258.0 110 3.08 3.215 19.44  1  0    3    1                       3
Run Code Online (Sandbox Code Playgroud)

在 的情况下select,我们有多个表达式,由以下处理!!!

mtcars %>% select( !!!select_expr )
#                      mpg cyl
# Mazda RX4           21.0   6
# Mazda RX4 Wag       21.0   6
# Datsun 710          22.8   4
Run Code Online (Sandbox Code Playgroud)

PS 还值得一提的是,它select可以直接使用字符串向量,而不必先使用rlang::parse_expr()它们:

mtcars %>% select( c("mpg", "cyl") )
#                      mpg cyl
# Mazda RX4           21.0   6
# Mazda RX4 Wag       21.0   6
# Datsun 710          22.8   4
Run Code Online (Sandbox Code Playgroud)