我正在尝试过滤掉R中的整行,但前提是特定集合的频率加起来不超过5.
我的数据看起来有点像这样.这是我目前称之为"单词"的数据框:
HEADWORD VARIANT FREQUENCY
SWORD sword 2
SWORD swerd 1
SWORD sworde 1
KNIGHT knight 6
KNIGHT kniht 2
KNIGHT knyt 1
Run Code Online (Sandbox Code Playgroud)
我只想要特定词条中的频率加起来超过5的行.所以在这里,我想保留KNIGHT的所有实例,但我想完全摆脱所有的SWORD行.
我尝试在dplyr上执行此操作,但没有成功.这是我试过的代码:
Words1 %>% group_by(HW) %>% filter(Fr > 5)
Run Code Online (Sandbox Code Playgroud)
我不知道如何做到这一点,我真的很感激任何帮助!
我正在尝试过滤掉R中不需要的多行数据,但我不知道该怎么做.
我正在使用的数据看起来有点像这样:
Category Item Shop1 Shop2 Shop3
1 Fruit Apples 4 6 0
2 Fruit Oranges 0 2 7
3 Veg Potatoes 0 0 0
4 Veg Onions 0 0 0
5 Veg Carrots 0 0 0
6 Dairy Yoghurt 0 0 0
7 Dairy Milk 0 1 0
8 Dairy Cheese 0 0 0
Run Code Online (Sandbox Code Playgroud)
我只想保留至少有一个商品至少有一个商店具有正值的类别.
在这种情况下,我想摆脱所有的Veg行,因为没有商店出售任何蔬菜.我希望将所有的Fruit行,我想保持 所有的Dairy行,即使是那些在所有店铺零值,因为一个Dairy行确实有大于0的值.
我试图在使用colSums后使用group_by(Category),希望它每次都只是对类别的内容求和,但它不起作用.我还尝试在rowSums的末尾添加一个列并根据频率进行过滤,但我只能这样过滤掉各行,而不是基于整个类别的行.
虽然我可以过滤出值为零的单个行(例如第3行),但我的难度是保留在行6和8等行中,其中每个商店的所有值都为零,但我想保留这些行,因为其他Dairy行的值大于零.