我正在尝试过滤掉R中的整行,但前提是特定集合的频率加起来不超过5.
我的数据看起来有点像这样.这是我目前称之为"单词"的数据框:
HEADWORD VARIANT FREQUENCY
SWORD sword 2
SWORD swerd 1
SWORD sworde 1
KNIGHT knight 6
KNIGHT kniht 2
KNIGHT knyt 1
Run Code Online (Sandbox Code Playgroud)
我只想要特定词条中的频率加起来超过5的行.所以在这里,我想保留KNIGHT的所有实例,但我想完全摆脱所有的SWORD行.
我尝试在dplyr上执行此操作,但没有成功.这是我试过的代码:
Words1 %>% group_by(HW) %>% filter(Fr > 5)
Run Code Online (Sandbox Code Playgroud)
我不知道如何做到这一点,我真的很感激任何帮助!
我们需要得到sum'FREQUENCY',并在filter'HEADWORD'后的分组中检查它是否大于5
Words1 %>%
group_by(HEADWORD) %>%
filter(sum(FREQUENCY) >5)
# HEADWORD VARIANT FREQUENCY
# <chr> <chr> <int>
#1 KNIGHT knight 6
#2 KNIGHT kniht 2
#3 KNIGHT knyt 1
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
1656 次 |
| 最近记录: |