我有来自分层简单随机抽样设计的调查数据,其中某些层仅包含单个抽样单位(即使层总体规模可能>1)。这些在 R 调查包 ( http://r-survey.r-forge.r-project.org/survey/exmample-lonely.html )中被称为“孤独 PSU” 。处理这种情况有多种选择,我感兴趣的是“调整”选项。
的文档options(survey.lonely.psu="adjust")指出
“单个 PSU 层的数据以样本总平均值为中心,而不是层平均值。”
在尝试此选项时,我预计如果更改另一个层中的数据,我的单 PSU 层的方差将会改变,但事实并非如此。这是一个小例子:
library(survey)
options(survey.lonely.psu="adjust")
# sample 1
dat1 <- data.frame(N = c(3, 3, 2), h = c(1, 1, 2), y = c(2, 6, 15))
survey1 <- svydesign(~1, fpc = ~N, strata = ~h, data = dat1)
svyby(~y, by = ~h, design = survey1, FUN = svytotal)
Run Code Online (Sandbox Code Playgroud)
在结果中,请注意层 2(即单 PSU 层)的标准误差:
h y se
1 1 12 3.464102
2 2 30 21.213203
Run Code Online (Sandbox Code Playgroud)
现在,如果我像这样更改层 1 中的数据 …