小编Bry*_*yan的帖子

在 R 调查包中对单独的 PSU 使用“调整”选项:为什么当其他层中的数据发生变化时,单个 PSU 层方差不会发生变化?

我有来自分层简单随机抽样设计的调查数据,其中某些层仅包含单个抽样单位(即使层总体规模可能>1)。这些在 R 调查包 ( http://r-survey.r-forge.r-project.org/survey/exmample-lonely.html )中被称为“孤独 PSU” 。处理这种情况有多种选择,我感兴趣的是“调整”选项。

的文档options(survey.lonely.psu="adjust")指出

“单个 PSU 层的数据以样本总平均值为中心,而不是层平均值。”

在尝试此选项时,我预计如果更改另一个层中的数据,我的单 PSU 层的方差将会改变,但事实并非如此。这是一个小例子:

library(survey)
options(survey.lonely.psu="adjust")

# sample 1
dat1 <- data.frame(N = c(3, 3, 2), h = c(1, 1, 2), y = c(2, 6, 15))
survey1 <- svydesign(~1, fpc = ~N, strata = ~h, data = dat1)
svyby(~y, by = ~h, design = survey1, FUN = svytotal)
Run Code Online (Sandbox Code Playgroud)

在结果中,请注意层 2(即单 PSU 层)的标准误差:

  h  y        se
1 1 12  3.464102
2 2 30 21.213203
Run Code Online (Sandbox Code Playgroud)

现在,如果我像这样更改层 1 中的数据 …

r survey variance

8
推荐指数
1
解决办法
3549
查看次数

标签 统计

r ×1

survey ×1

variance ×1