我希望运行一个 logit 回归来预测家庭规模和年龄平均值的边际效应,以及二元指标(个人是否是移民、是否有健康保险或吸烟)对患高血压的预测概率的影响.
该数据来自聚类调查,我希望在输出中包含稳健的聚类标准误差。
但是,当我添加代码以包含强大的集群 SE 时,我收到一个错误,即不再找到回归中的变量,我不知道为什么。任何建议都会很棒!谢谢。
AGE IMMIGRANT FAMSIZE HLTH_INS HYPERTEN SMOKE PSU
<int> <dbl> <int> <dbl> <dbl> <dbl> <int>
40 0 2 1 0 0 2
23 0 2 1 0 0 1
24 0 2 1 0 0 2
18 0 3 1 1 0 2
30 0 2 1 0 0 2
33 1 6 0 0 0 1
#or if this is an easier output to reproduce:
structure(list(AGE = c(40L, 23L, 24L, 18L, 30L, 33L, …Run Code Online (Sandbox Code Playgroud)