符合data.frame中的因素(或字符串)

Wil*_*car 2 r

如何重新编码data.frame中的因素(或字符串)的逻辑?

data <- data.frame(year = c(2015, 2015, 2016, 2016),
               column2 = c(4, NA, 9, 1))


library (dplyr)

missing_data <- data %>%
              count(year, complete.cases(column2)) 

names(missing_data)[2] = "col2" 
Run Code Online (Sandbox Code Playgroud)

我的结果:

year  col2     n
(dbl) (lgl) (int)
2015 FALSE     1
2015  TRUE     1
2016  TRUE     2 
Run Code Online (Sandbox Code Playgroud)

我想要的是:

year  col2      n
(dbl)        (int)
2015  unknown    1
2015  known      1
2016  known      2 
Run Code Online (Sandbox Code Playgroud)

我尝试过的(在dplyr链中):

mutate(col2 = as.factor(col2))
Run Code Online (Sandbox Code Playgroud)

小智 5

这个应该做。

missing_data$col2 <- factor(missing_data$col2, labels=c("unknown", "known"))
Run Code Online (Sandbox Code Playgroud)