我在数据框中有一列超过 40 个级别,我想将其设为 4 个级别。重要的变量是“电子商务”、“技术”和“消费品”,我想归入“其他”的所有其他变量。我怎样才能把它变成4个级别?
我们可以%in%用来检查:
df$column_name <- as.character(df$column_name)
df$column_name[!df$column_name %in% c('ecommerce', 'technology', 'consumer goods')] <- 'Other'
Run Code Online (Sandbox Code Playgroud)
如果要将列保留为因子:
levels(df$column_name) <- c(levels(df$column_name), 'Other')
df$column_name[!df$column_name %in% c('ecommerce', 'technology', 'consumer goods')] <- 'Other'
Run Code Online (Sandbox Code Playgroud)