有没有一种方法,以指导dplyr
使用summarise_each
与na.rm=TRUE
?我想采用变量的均值,summarise_each("mean")
但我不知道如何指定它来忽略缺失值.
flo*_*del 94
按照文档中的链接,您似乎可以使用funs(mean(., na.rm = TRUE))
:
library(dplyr)
by_species <- iris %>% group_by(Species)
by_species %>% summarise_each(funs(mean(., na.rm = TRUE)))
Run Code Online (Sandbox Code Playgroud)
Tje*_*ebo 13
由于summarise_each
现在已经过时,一个附加的应答使用summarise_all
.
na.rm = TRUE
范围内的funs
参数(CF @flodel的回答是:只需更换summarise_each
用summarise_all
). na.rm = TRUE
后的funs
说法.当您想要调用多个函数时,这非常有用,例如:
require(dplyr)
iris %>%
group_by(Species) %>%
summarise_all(funs(mean, max, sd), na.rm = TRUE)
Run Code Online (Sandbox Code Playgroud)