在基本RI中,可以使用以下代码删除/替换整个数据帧中的值(例如,所有NA或大于0.99的值)。
df[df > 0.99] <- NA
df[is.na(df)] <- 0L
Run Code Online (Sandbox Code Playgroud)
有没有办法在tidyverse中使用dplyr执行等效操作?
你可以用mutate_all与replace:
df = data.frame(x = c(1.2, 0.4, NA, 0.6), y = c(NA, 0.3, 0.992, 0.5))
df %>% mutate_all(~ replace(., . > 0.99 | is.na(.), 0))
# x y
#1 0.0 0.0
#2 0.4 0.3
#3 0.0 0.0
#4 0.6 0.5
Run Code Online (Sandbox Code Playgroud)
或使用funs:
df %>% mutate_all(funs(replace(., . > 0.99 | is.na(.), 0)))
Run Code Online (Sandbox Code Playgroud)
如果只需要将此集成到管道中,则replace方法应该可以工作:
df %>% replace(. > 0.99 | is.na(.), 0)
Run Code Online (Sandbox Code Playgroud)