R dplyr - rollmean 使用按列分组

Cke*_*eng 0 r

我有一个数据框如下:

(如果数据不符合格式,请查找图像)

Sample Data                     
date    id  name    loc mean    count   mean
9/6/2016    kar1    AAA 100004  0   1   
9/8/2016    kar1    AAA 100004  0   3   
9/9/2016    kar1    AAA 100004  0   4   
9/10/2016   kar1    AAA 100004  0   5   
9/11/2016   kar1    AAA 100004  0   6   
9/12/2016   kar1    AAA 100004  0   7   
9/13/2016   kar1    AAA 100004  0   8   
9/14/2016   kar1    AAA 100004  0   9   
9/7/2016    blr1    BBB 100004  0   2   
Run Code Online (Sandbox Code Playgroud)

我正在尝试根据 id、name、loc 在计数字段上计算((7 天滚动平均值))3 天滚动平均值(前 3 天和后 3 天),但结果不符合预期。

找到以下代码:

fnrollmean <- function(x) rollmean(df$count,7,na.pad=TRUE,align="center")

rollmeandf <- df %>% group_by(id,name,loc) %>% arrange(id,name,loc) %>% mutate(funs=fnrollmean(df$count))
Run Code Online (Sandbox Code Playgroud)

我得到错误:

eval(substitute(expr)、envir、enclos) 中的错误:大小不兼容 (9),需要 8(组大小)或 1

如果我只是这样做:

test2 <- df %>% mutate(funs=fnrollmean(df$count))
Run Code Online (Sandbox Code Playgroud)

它有效,但通过考虑所有错误的疾病进行计算。

如果遗漏了什么或任何解决方法,请告诉我。

预期成绩:

date    id  name    loc mean    count   mean
9/6/2016    kar1    AAA 100004  0   1   NA
9/8/2016    kar1    AAA 100004  0   3   NA
9/9/2016    kar1    AAA 100004  0   4   NA
9/10/2016   kar1    AAA 100004  0   5   4.8
9/11/2016   kar1    AAA 100004  0   6   6
9/12/2016   kar1    AAA 100004  0   7   NA
9/13/2016   kar1    AAA 100004  0   8   NA
9/14/2016   kar1    AAA 100004  0   9   NA
9/7/2016    blr1    BBB 100004  0   2   NA
Run Code Online (Sandbox Code Playgroud)

图像中的样本数据

谢谢

aic*_*hao 5

要使用mutate,您必须有一个窗口函数,该函数返回与函数输入的向量相同长度的向量(或返回一个标量,该标量将被强制转换为填充有标量值的该长度的向量)。问题是你fnrollmean没有,因此错误。请注意,即使在使用您发布的输入数据遵循 jdobre 的评论后,相同类型的错误仍将保留,因为您的第二组(blr1, BBB, 100004)只有1行。因此,修改fnrollmean为:

library(zoo)
fnrollmean <- function (x) {
  if (length(x) < 7) {
    rep(NA,length(x)) 
  } else {
    rollmean(x,7,align="center",na.pad=TRUE)
  }
}
Run Code Online (Sandbox Code Playgroud)

请注意,我们按照 jdobre 的注释使用x而不是df$count在函数内使用。然后(再次按照 jdobre 的注释使用count而不是df$countfnrollmean内调用时mutate):

library(dplyr)
result <- df %>% group_by(id,name,loc) %>% 
                 mutate(rollavg=fnrollmean(count))
Run Code Online (Sandbox Code Playgroud)

给出:

print(result)
##Source: local data frame [9 x 7]
##Groups: id, name, loc [2]
##
##       date     id   name    loc  mean count  rollavg
##     <fctr> <fctr> <fctr>  <int> <int> <int>    <dbl>
##1  9/6/2016   kar1    AAA 100004     0     1       NA
##2  9/8/2016   kar1    AAA 100004     0     3       NA
##3  9/9/2016   kar1    AAA 100004     0     4       NA
##4 9/10/2016   kar1    AAA 100004     0     5 4.857143
##5 9/11/2016   kar1    AAA 100004     0     6 6.000000
##6 9/12/2016   kar1    AAA 100004     0     7       NA
##7 9/13/2016   kar1    AAA 100004     0     8       NA
##8 9/14/2016   kar1    AAA 100004     0     9       NA
##9  9/7/2016   blr1    BBB 100004     0     2       NA
Run Code Online (Sandbox Code Playgroud)