use*_*829 5 r dataset dataframe
我希望在大量数据集上进行4天的滚动平均值.问题是有些人没有4个案例,因此我得到一个错误,表明k <= n不是TRUE.
有没有办法删除数据集中没有足够数据的任何个人?
以下是数据外观的示例:
Name variable.1
1 Kim 64.703950
2 Kim 926.339849
3 Kim 128.662977
4 Kim 290.888594
5 Kim 869.418523
6 Bob 594.973849
7 Bob 408.159544
8 Bob 609.140928
9 Joseph 496.779712
10 Joseph 444.028668
11 Joseph -213.375635
12 Joseph -76.728981
13 Joseph 265.642784
14 Hank -91.646728
15 Hank 170.209746
16 Hank 97.889889
17 Hank 12.069074
18 Hank 402.361731
19 Earl 721.941796
20 Earl 4.823148
21 Earl 696.299627
Run Code Online (Sandbox Code Playgroud)
如果您的数据框是df,您可以使用以下命令删除出现次数少于 4 次的所有名称dplyr:
library(dplyr)
df %>%
group_by(Name) %>%
filter(n() >= 4)
Run Code Online (Sandbox Code Playgroud)