Nil*_*ils 5 r case-when mutate
根据一列中的文本,我想为另外两列分配一个字符和一个整数。用于将字符分配给一列和整数分配给另一列的多个 case_when 条件 (LHS) 相等,只有结果 (RHS) 不同。我正在使用exprsand!!!因为我只想在一个表中维护表达式列表的基础。
我的代码是:
library(rlang)
library(tidyverse)
df <- data.frame(a=c("text-1" , "text_2", "text3"))
e1 <-
exprs(
grepl("text-", a) ~ "a",
grepl("text_", a) ~ "b",
grepl("text[0-9]", a) ~ "c"
)
e2 <-
exprs(
grepl("text-", a) ~ 0,
grepl("text_", a) ~ 1,
grepl("text[0-9]", a) ~ 2
)
test <- df %>% mutate(b=case_when(!!!e1),
c=case_when(!!!e2)
)
Run Code Online (Sandbox Code Playgroud)
预期结果是:
> test
a b c
1 text-1 a 0
2 text_2 b 1
3 text3 c 2
Run Code Online (Sandbox Code Playgroud)
但是使用两个具有相同 LHS 的 case_when 表达式列表似乎是多余且低效的(有数百万条记录)。我怎样才能更有效地达到相同的结果?
我不清楚这背后的主要动机,但使用@zx8754的建议我们可以做到
library(dplyr)
library(rlang)
e1 <- exprs(
grepl("text-", a) ~ "a, 0",
grepl("text_", a) ~ "b, 1",
grepl("text[0-9]", a) ~ "c, 2")
df %>%
mutate(b=case_when(!!!e1)) %>%
tidyr::separate(b, into = c("b", "c"), sep = ",", convert = TRUE)
# a b c
#1 text-1 a 0
#2 text_2 b 1
#3 text3 c 2
Run Code Online (Sandbox Code Playgroud)