小编use*_*687的帖子

AIC在biglm和lm之间有所不同

我一直在尝试使用biglm在大型数据集上运行线性回归(大约60,000,000行).我想使用AIC进行模型选择.但是我发现在较小的数据集上使用biglm时,biglm返回的AIC变量与lm返回的变量不同.这甚至适用于biglm帮助中的示例.

data(trees)
ff<-log(Volume)~log(Girth)+log(Height)

chunk1<-trees[1:10,]
chunk2<-trees[11:20,]
chunk3<-trees[21:31,]

library(biglm)
a <- biglm(ff,chunk1)
a <- update(a,chunk2)
a <- update(a,chunk3)

AIC(a)#48.18546

a_lm <- lm(ff, trees)
AIC(a_lm)#-62.71125
Run Code Online (Sandbox Code Playgroud)

有人可以解释一下这里发生了什么吗?使用biglm生成的AIC是否可以安全地用于比较同一数据集上的biglm模型?

r lm model-comparison

5
推荐指数
1
解决办法
678
查看次数

标签 统计

lm ×1

model-comparison ×1

r ×1