Ana*_*ras 4 regression r glmnet
我不能在岭回归中做置信区间.我有这个模型.
model5 <- glmnet(train_x,train_y,family = "gaussian",alpha=0, lambda=0.01)
Run Code Online (Sandbox Code Playgroud)
当我做预测时,我使用这些命令:
test_pred <- predict(model5, test_x, type = "link")
Run Code Online (Sandbox Code Playgroud)
有人知道如何做预测的置信区间?
事实证明,glmnet这不会提供标准错误(因此不会给出置信区间),如此处所述,并且也在此小插图中解决(摘录如下):
询问回归系数或其他估计量的标准误差是一个非常自然的问题.原则上,可以容易地计算这样的标准误差,例如使用自举.
不过,这个软件包故意不提供它们.其原因在于标准误差对于强烈偏差估计而言并不是非常有意义,例如由惩罚估计方法引起的.惩罚估计是通过引入实质偏差来减少估计量方差的过程.因此,每个估计量的偏差是其均方误差的主要组成部分,而其方差可能只贡献一小部分.
不幸的是,在惩罚性回归的大多数应用中,不可能获得足够精确的偏差估计.任何基于bootstrap的计算都只能评估估计的方差.只有在可靠的无偏估计可用时才能获得可靠的偏差估计,而在使用惩罚估计的情况下通常不是这种情况.
因此,报告惩罚估计的标准误差只能说明故事的一部分.它可能给人一种极其精确的错误印象,完全忽略了偏差造成的不准确性.做出基于对估计方差的评估的置信度陈述肯定是错误的,例如基于引导程序的置信区间.
在使用在lm,glm和coxph中实现的标准广义线性模型理论的低维模型的情况下,可以获得在惩罚估计周围的可靠置信区间.据我所知,在高维情况下构建可靠置信区间的方法是不可用的.
但是,如果您坚持置信区间,请查看此帖子.