我正在使用一个包含mvar_1列的数据集,其名称是去年公民投票的5个政党之一.其他变量只是人口统计变量,因为每一方参与的集会数量,其他的东西.
当我使用以下代码时:
data.model.rf = randomForest(mvar_1 ~ mvar_2 + mvar_3 + mvar_4 + mvar_5 +
mvar_6 + mvar_7 + mvar_8 + mvar_9 + mvar_10 +
mvar_11 + mvar_15 + mvar_17 + mvar_18 + mvar_21 +
mvar_22 + mvar_23 + mvar_24 + mvar_25 + mvar_26 +
mvar_28, data=data.train, ntree=20000, mtry=15,
importance=TRUE, na.action = na.omit )
Run Code Online (Sandbox Code Playgroud)
出现此错误消息:
Error in randomForest.default(m, y, ...) :
Can not handle categorical predictors with more than 53 categories.
Run Code Online (Sandbox Code Playgroud) r ×1