岭回归的置信区间

Ana*_*ras 4 regression r glmnet

我不能在岭回归中做置信区间.我有这个模型.

model5 <- glmnet(train_x,train_y,family = "gaussian",alpha=0, lambda=0.01)
Run Code Online (Sandbox Code Playgroud)

当我做预测时,我使用这些命令:

test_pred <- predict(model5, test_x, type = "link")
Run Code Online (Sandbox Code Playgroud)

有人知道如何做预测的置信区间?

ila*_*man 8

事实证明,glmnet这不会提供标准错误(因此不会给出置信区间),如此处所述,并且也在此小插图中解决(摘录如下):

询问回归系数或其他估计量的标准误差是一个非常自然的问题.原则上,可以容易地计算这样的标准误差,例如使用自举.

不过,这个软件包故意不提供它们.其原因在于标准误差对于强烈偏差估计而言并不是非常有意义,例如由惩罚估计方法引起的.惩罚估计是通过引入实质偏差来减少估计量方差的过程.因此,每个估计量的偏差是其均方误差的主要组成部分,而其方差可能只贡献一小部分.

不幸的是,在惩罚性回归的大多数应用中,不可能获得足够精确的偏差估计.任何基于bootstrap的计算都只能评估估计的方差.只有在可靠的无偏估计可用时才能获得可靠的偏差估计,而在使用惩罚估计的情况下通常不是这种情况.

因此,报告惩罚估计的标准误差只能说明故事的一部分.它可能给人一种极其精确的错误印象,完全忽略了偏差造成的不准确性.做出基于对估计方差的评估的置信度陈述肯定是错误的,例如基于引导程序的置信区间.

在使用在lm,glm和coxph中实现的标准广义线性模型理论的低维模型的情况下,可以获得在惩罚估计周围的可靠置信区间.据我所知,在高维情况下构建可靠置信区间的方法是不可用的.

但是,如果您坚持置信区间,请查看帖子.