有没有一种方法,以指导dplyr使用summarise_each与na.rm=TRUE?我想采用变量的均值,summarise_each("mean")但我不知道如何指定它来忽略缺失值.
flo*_*del 94
按照文档中的链接,您似乎可以使用funs(mean(., na.rm = TRUE)):
library(dplyr)
by_species <- iris %>% group_by(Species)
by_species %>% summarise_each(funs(mean(., na.rm = TRUE)))
Run Code Online (Sandbox Code Playgroud)
Tje*_*ebo 13
由于summarise_each现在已经过时,一个附加的应答使用summarise_all.
na.rm = TRUE 范围内的funs参数(CF @flodel的回答是:只需更换summarise_each 用summarise_all). na.rm = TRUE 后的funs说法.当您想要调用多个函数时,这非常有用,例如:
require(dplyr)
iris %>%
group_by(Species) %>%
summarise_all(funs(mean, max, sd), na.rm = TRUE)
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
44822 次 |
| 最近记录: |