使用 R 调查包衡量收入不平等

use*_*457 5 inequality r survey gini

我正在使用该survey软件包处理美国社区调查微数据,并希望计算一些基本的收入不平等统计数据。我已将以下内容设置为我的设计:

testsurv <- svrepdesign(data=test, repweights = test[,8:87], weights = test$HHWT, 
                   combined.weights=TRUE, type = "Fay", rho = 0.5,scale=4/80, 
                   rscales = rep(1, 80), mse=TRUE)
Run Code Online (Sandbox Code Playgroud)

由此,我想按年计算基尼系数,以及收入的分位数比率,也按年计算。使用svybyand 生成分位数和相关错误很简单svyquantile

quants <- svyby(~INCOME, ~YEAR, testsurvey, svyquantile, 
              quantiles=c(0.9, 0.75, 0.5, 0.25, 0.1), keep.var=TRUE)
Run Code Online (Sandbox Code Playgroud)

这让我想到了我的第一个问题:如果每个分位数都有基于重复权重的误差,我该如何计算收入分位数比率(例如 90/10)的标准误差?我尝试使用,svyratio但这是针对整个变量的比率,而不是针对变量内的选定观察值。

第二个问题:有没有办法survey使用现有函数(如ginifrom )计算基尼系数(带有基于复制的误差)reldist?我尝试使用,withReplicates但效果不佳,可能是因为将gini其参数withReplicates排序为变量,然后是权重,但指定相反顺序的说明。我尝试了两种方法,但都没有奏效。例如,这里 HHWT 是样本权重:

> withReplicates(testsurv, gini(~HHWT, ~INCOME))
Run Code Online (Sandbox Code Playgroud)

这会产生以下错误消息:

Error in sum(weights) : invalid 'type' (language) of argument
In addition: Warning message:
In is.na(x) : is.na() applied to non-(list or vector) of type 'language'
Run Code Online (Sandbox Code Playgroud)

Ant*_*ico 3

使用 R 传送包。这在 CRAN 上尚不可用,但您可以使用以下命令快速安装它

devtools::install_github("djalmapessoa/convey")
Run Code Online (Sandbox Code Playgroud)

对于 90 与 10 的比例,使用该?svyqsr函数并设置alpha=0.1,因为它默认为 80 和 20

对于基尼系数,使用?svygini函数

只要您有 acs 重复加权调查设计,这些都应该是简单的计算。convey_prep请务必在调用后立即使用该功能svrepdesign