小编cmd*_*ret的帖子

使用dplyr根据多列中的行值选择列

我试图选择至少有一行等于1的列,只有当同一行在第二列中也有一定值时.我更愿意使用dplyr实现这一点,但欢迎任何计算效率高的解决方案.

例:

选择a1,a2,a3中包含至少一行的值,其中值为1,其中列b =="B"

示例数据:

rand <- function(S) {set.seed(S); sample(x = c(0,1),size = 3, replace=T)}
df <- data.frame(a1=rand(1),a2=rand(2),a3=rand(3),b=c("A","B","A"))
Run Code Online (Sandbox Code Playgroud)

输入数据:

  a1 a2 a3 b
1  0  0  0 A
2  0  1  1 B
3  1  1  0 A
Run Code Online (Sandbox Code Playgroud)

期望的输出:

  a2 a3
1  0  0
2  1  1
3  1  0
Run Code Online (Sandbox Code Playgroud)

我设法使用以下代码获得正确的输出,但是这是一个非常低效的解决方案,我需要在非常大的数据帧(365,000行X 314列)上运行它.

df %>% select_if(function(x) any(paste0(x,.$b) == '1B'))
Run Code Online (Sandbox Code Playgroud)

r dplyr

5
推荐指数
1
解决办法
1476
查看次数

标签 统计

dplyr ×1

r ×1