mik*_*ike 4 regression r survey sampling
我使用 R 中的 svydesign 包来运行调查加权 logit 回归,如下所示:
sdobj <- svydesign(id = ~0, weights = ~chweight, strata = ~strata, data = svdat)
model1 <- svyglm(formula=formula1,design=sdobj,family = quasibinomial)
Run Code Online (Sandbox Code Playgroud)
但是,该文档对未指定有限总体修正 (FPC) 的回归提出了警告:
If fpc is not specified then sampling is assumed to be
with replacement at the top level and only the first stage of
cluster is used in computing variances.
Run Code Online (Sandbox Code Playgroud)
不幸的是,我没有足够的信息来指定每个级别的人口(我对其中的抽样很少)。任何关于如何在没有 FPC 信息的情况下指定调查权重的信息都会非常有帮助。
小智 7
你做对了。“替换”是调查统计术语,表示您在这种情况下想要什么。
如果抽样分数较低,则标准做法是使用近似值,如果抽样分数无穷小或抽样采用放回抽样,则该近似值将是精确的。没有人真正进行替换调查,但近似值几乎是普遍存在的。使用此近似值,您不需要提供 fpc,相反,如果您不提供 fpc,svydesign() 会假设您需要此近似值。