Car*_*arl 3 r survey linear-regression
我发现包中predict的svyglm对象和对象有一些奇怪的行为survey。如果您的 newdata 中predict的因子/字符具有一个级别,则会输出错误:
Error in `contrasts<-`(`*tmp*`, value = contr.funs[1 + isOF[nn]]) :
contrasts can be applied only to factors with 2 or more levels
Run Code Online (Sandbox Code Playgroud)
如果我将一个单级变量作为模型的预测变量,这个错误是有道理的,但对于 newdata 我没有看到问题。
定期glm这工作正常。
雷:
library(survey)
data(api)
dstrat<-svydesign(id=~1,strata=~stype, weights=~pw, data=apistrat, fpc=~fpc)
svymodel <- svyglm(api00~sch.wide,design=dstrat)
# errors
predict(svymodel, data.frame(sch.wide=rep("No",10)))
regmodel <- glm(api00~sch.wide,data=apistrat)
# works
predict(regmodel,data.frame(sch.wide=rep("No",10)))
Run Code Online (Sandbox Code Playgroud)
我发现如果我破解因子的水平它会起作用,但这应该不是必需的:
svymodel <- svyglm(api00~sch.wide,design=dstrat)
predict(svymodel, data.frame(sch.wide=factor(rep("No",10),
levels = c("No","random phrase"))))
Run Code Online (Sandbox Code Playgroud)
我是不是误解了什么,或者这是survey包裹的问题?
您没有考虑因素newdata;你要输入一个字符串。你应该输入一个与用于拟合模型的因子具有相同级别的因子(不是一些随机短语)——这是设计矩阵有意义的唯一方式。
predict(svymodel, data.frame(sch.wide=factor(rep("No",10),levels=c("No","Yes"))))
Run Code Online (Sandbox Code Playgroud)
predict.lm从拟合对象中恢复因子水平(我不记得这是在 2002 年左右,但我可能错了)。您可以使用这种方法来自动化:
predict(svymodel, data.frame(sch.wide=factor(rep("No",10),levels=svymodel$xlevels$sch.wide)))
Run Code Online (Sandbox Code Playgroud)
我会把它放在包裹里要做的事情的清单上。