R glm对象和使用偏移的预测

ElC*_*apo 4 r logistic-regression

所以我使用R进行逻辑回归,但我正在使用偏移量.

  mylogit <- glm(Y ~  X1 + offset(0.2*X2) + offset(0.4*X3), data = test, family = "binomial")
Run Code Online (Sandbox Code Playgroud)

输出仅显示单个系数,截距和其中一个预测变量X1.

    Coefficients:
    (Intercept)               X1
      0.5250748         0.0157259
Run Code Online (Sandbox Code Playgroud)

我的问题:如何从这个模型的每个观察中得到原始预测?更具体地说,如果我使用预测函数,它是否包括所有特征及其系数,即使模型系数被列为仅包含截距和X1?

  prob = predict(mylogit,test,type=c("response"))
Run Code Online (Sandbox Code Playgroud)

我必须使用预测功能吗?"mylogit"对象是否包含我可以直接计算的任何内容?(是的,我查看了关于glm的文档,仍然感到困惑).

谢谢你的病人.

42-*_*42- 7

我可以用glm和报告一些实验的结果offset().它不会出现(至少从这个实验中)您的调用predict会给出考虑的结果offset.相反,似乎summary.glm需要为此目的.我开始对第一个例子进行了相当严格的修改?glm(如果你确实提供了数据,这对你的关注点更为相关,因为那时我们可以使用你需要的"test"来更多地使用newdata参数.)

counts <- c(18,17,15,20,10,20,25,13,12)
outcome <- gl(3,1,9)
treatment <- gl(3,3)
print(d.AD <- data.frame(treatment, outcome, counts))
glm.D93 <- glm(counts ~ outcome + treatment + offset(1:9), family = poisson())
glm.D93d <- glm(counts ~ outcome + treatment , family = poisson())

> predict(glm.D93d, type="response")
       1        2        3        4        5        6        7        8        9 
21.00000 13.33333 15.66667 21.00000 13.33333 15.66667 21.00000 13.33333 15.66667 
> predict(glm.D93, type="response")
       1        2        3        4        5        6        7        8        9 
21.00000 13.33333 15.66667 21.00000 13.33333 15.66667 21.00000 13.33333 15.66667 
Run Code Online (Sandbox Code Playgroud)

据我所知,offset只有在为了统计推断的目的而对NULL估计(通常为0)进行估计系数的比较时才明显.这是通过summary.glm:

> summary(glm.D93)$coef
             Estimate Std. Error    z value      Pr(>|z|)
(Intercept)  2.044522  0.1708987  11.963362  5.527764e-33
outcome2    -1.454255  0.2021708  -7.193203  6.328878e-13
outcome3    -2.292987  0.1927423 -11.896644  1.232021e-32
treatment2  -3.000000  0.2000000 -15.000000  7.341915e-51
treatment3  -6.000000  0.2000000 -30.000000 9.813361e-198
> summary(glm.D93d)$coef
                 Estimate Std. Error       z value     Pr(>|z|)
(Intercept)  3.044522e+00  0.1708987  1.781478e+01 5.426767e-71
outcome2    -4.542553e-01  0.2021708 -2.246889e+00 2.464711e-02
outcome3    -2.929871e-01  0.1927423 -1.520097e+00 1.284865e-01
treatment2   1.337909e-15  0.2000000  6.689547e-15 1.000000e+00
treatment3   1.421085e-15  0.2000000  7.105427e-15 1.000000e+00
Run Code Online (Sandbox Code Playgroud)

偏移量仅改变参考水平(在这个受损的例子中有相当奇怪的变化),而数据的拟合$linear.predictors$fitted数据不受影响.我没有在glm中看到影响这一点的评论,但是有一条评论?lm:"offset指定的偏移量不会包含在predict.lm的预测中,而公式中偏移项指定的偏移量将是." 我承认我从阅读中得到的洞察力很少?model.offset.