基于R中大数据集中没有足够重复数据的行去除行

use*_*829 5 r dataset dataframe

我希望在大量数据集上进行4天的滚动平均值.问题是有些人没有4个案例,因此我得到一个错误,表明k <= n不是TRUE.

有没有办法删除数据集中没有足够数据的任何个人?

以下是数据外观的示例:

     Name  variable.1
1     Kim   64.703950
2     Kim  926.339849
3     Kim  128.662977
4     Kim  290.888594
5     Kim  869.418523
6     Bob  594.973849
7     Bob  408.159544
8     Bob  609.140928
9  Joseph  496.779712
10 Joseph  444.028668
11 Joseph -213.375635
12 Joseph  -76.728981
13 Joseph  265.642784
14   Hank  -91.646728
15   Hank  170.209746
16   Hank   97.889889
17   Hank   12.069074
18   Hank  402.361731
19   Earl  721.941796
20   Earl    4.823148
21   Earl  696.299627
Run Code Online (Sandbox Code Playgroud)

dav*_*ers 4

如果您的数据框是df,您可以使用以下命令删除出现次数少于 4 次的所有名称dplyr

library(dplyr)

df %>%
  group_by(Name) %>%
  filter(n() >= 4)
Run Code Online (Sandbox Code Playgroud)