根据R中不同列的值之和过滤行组

Ros*_*ose 3 r dplyr

我正在尝试过滤掉R中的整行,但前提是特定集合的频率加起来不超过5.

我的数据看起来有点像这样.这是我目前称之为"单词"的数据框:

HEADWORD VARIANT FREQUENCY
 SWORD    sword      2
 SWORD    swerd      1
 SWORD    sworde     1
 KNIGHT   knight     6
 KNIGHT   kniht      2
 KNIGHT   knyt       1
Run Code Online (Sandbox Code Playgroud)

我只想要特定词条中的频率加起来超过5的行.所以在这里,我想保留KNIGHT的所有实例,但我想完全摆脱所有的SWORD行.

我尝试在dplyr上执行此操作,但没有成功.这是我试过的代码:

Words1 %>% group_by(HW) %>%  filter(Fr > 5)
Run Code Online (Sandbox Code Playgroud)

我不知道如何做到这一点,我真的很感激任何帮助!

akr*_*run 7

我们需要得到sum'FREQUENCY',并在filter'HEADWORD'后的分组中检查它是否大于5

Words1 %>% 
     group_by(HEADWORD) %>% 
     filter(sum(FREQUENCY) >5)   
#   HEADWORD VARIANT FREQUENCY
#     <chr>   <chr>     <int>
#1   KNIGHT  knight         6
#2   KNIGHT   kniht         2 
#3   KNIGHT    knyt         1
Run Code Online (Sandbox Code Playgroud)