小编Ros*_*ose的帖子

根据R中不同列的值之和过滤行组

我正在尝试过滤掉R中的整行,但前提是特定集合的频率加起来不超过5.

我的数据看起来有点像这样.这是我目前称之为"单词"的数据框:

HEADWORD VARIANT FREQUENCY
 SWORD    sword      2
 SWORD    swerd      1
 SWORD    sworde     1
 KNIGHT   knight     6
 KNIGHT   kniht      2
 KNIGHT   knyt       1
Run Code Online (Sandbox Code Playgroud)

我只想要特定词条中的频率加起来超过5的行.所以在这里,我想保留KNIGHT的所有实例,但我想完全摆脱所有的SWORD行.

我尝试在dplyr上执行此操作,但没有成功.这是我试过的代码:

Words1 %>% group_by(HW) %>%  filter(Fr > 5)
Run Code Online (Sandbox Code Playgroud)

我不知道如何做到这一点,我真的很感激任何帮助!

r dplyr

3
推荐指数
1
解决办法
1656
查看次数

根据多行中的值过滤R中的行

我正在尝试过滤掉R中不需要的多行数据,但我不知道该怎么做.

我正在使用的数据看起来有点像这样:

  Category     Item Shop1 Shop2 Shop3
1    Fruit   Apples     4     6     0
2    Fruit  Oranges     0     2     7
3      Veg Potatoes     0     0     0
4      Veg   Onions     0     0     0
5      Veg  Carrots     0     0     0
6    Dairy  Yoghurt     0     0     0
7    Dairy     Milk     0     1     0
8    Dairy   Cheese     0     0     0
Run Code Online (Sandbox Code Playgroud)

我只想保留至少有一个商品至少有一个商店具有正值的类别.

在这种情况下,我想摆脱所有的Veg行,因为没有商店出售任何蔬菜.我希望将所有的Fruit行,我想保持 所有Dairy行,即使是那些在所有店铺零值,因为一个Dairy行确实有大于0的值.

我试图在使用colSums后使用group_by(Category),希望它每次都只是对类别的内容求和,但它不起作用.我还尝试在rowSums的末尾添加一个列并根据频率进行过滤,但我只能这样过滤掉各行,而不是基于整个类别的行.

虽然我可以过滤出值为零的单个行(例如第3行),但我的难度是保留在行6和8等行中,其中每个商店的所有值都为零,但我想保留这些行,因为其他Dairy行的值大于零.

r dataframe dplyr

3
推荐指数
1
解决办法
1731
查看次数

标签 统计

dplyr ×2

r ×2

dataframe ×1