过滤以在特定列中的特定值第一次出现之前删除所有行

Question

过滤以在特定列中的特定值第一次出现之前删除所有行

我想在特定列中的特定值第一次出现之前过滤以删除所有行。例如，在下面的数据框中，我想删除第一次bob出现在列中之前的所有行a。请注意，bob第二次重复的值- 我只想在第一次bob出现之前删除行。

(dat<-data.frame(a= c("pete", "mike", "bob", "bart", "bob"), b=c(1,2,3,4,5), c=c("home", "away", "home", "away", "gone")))
     a b    c
1 pete 1 home
2 mike 2 away
3  bob 3 home
4 bart 4 away
5  bob 5 gone

Run Code Online (Sandbox Code Playgroud)

我希望生成的数据框如下所示：

   a   b  c
1 bob  3 home
2 bart 4 away
3 bob  5 gone

Run Code Online (Sandbox Code Playgroud)

Answer 1

Ron*_*hah 8

dplyr使用方式slice。

library(dplyr)
dat %>% slice(which.max(a == "bob") : n())

#     a b    c
#1  bob 3 home
#2 bart 4 away
#3  bob 5 gone

Run Code Online (Sandbox Code Playgroud)

这在基础 R 中将是

dat[which.max(dat$a == "bob") : nrow(dat), ]

Run Code Online (Sandbox Code Playgroud)

Answer 2

mar*_*kus 5

cumsum通常是执行此类任务的良好人选

dat[cumsum(dat$a == "bob") >= 1, ]
#     a b    c
#3  bob 3 home
#4 bart 4 away
#5  bob 5 gone

Run Code Online (Sandbox Code Playgroud)

归档时间：	7 年，1 月前
查看次数：	230 次
最近记录：	5 年，1 月前