如何重新编码data.frame中的因素(或字符串)的逻辑?
data <- data.frame(year = c(2015, 2015, 2016, 2016),
column2 = c(4, NA, 9, 1))
library (dplyr)
missing_data <- data %>%
count(year, complete.cases(column2))
names(missing_data)[2] = "col2"
Run Code Online (Sandbox Code Playgroud)
我的结果:
year col2 n
(dbl) (lgl) (int)
2015 FALSE 1
2015 TRUE 1
2016 TRUE 2
Run Code Online (Sandbox Code Playgroud)
我想要的是:
year col2 n
(dbl) (int)
2015 unknown 1
2015 known 1
2016 known 2
Run Code Online (Sandbox Code Playgroud)
我尝试过的(在dplyr链中):
mutate(col2 = as.factor(col2))
Run Code Online (Sandbox Code Playgroud)
小智 5
这个应该做。
missing_data$col2 <- factor(missing_data$col2, labels=c("unknown", "known"))
Run Code Online (Sandbox Code Playgroud)