T. *_*oud 5 random effects lasso-regression model-comparison
我想对一组360个观测值进行约150个固定效果变量和7个随机效果变量之间的模型选择。我决定将glassoLasso与Lasso过程一起用于混合模型。我没有进行大量研究,无法找到可比模型的一些例子,但没有成功。这是我的数据样本:
> str(RHI_12)
'data.frame': 350 obs. of 164 variables:
$ RHI_counts_12 : int 0 14 1 3 2 2 2 0 0 1 ...
$ Site : Factor w/ 6 levels "14_metzerlen",..: 1 1 1 1 1 1 1 1 1 1 ...
$ Location : Factor w/ 30 levels "1","2","3","4",..: 1 2 3 4 5 6 7 8 9 10 ...
$ Dist_roost : num 0.985 0.88 0.908 0.888 0.89 ...
$ Natural_light : num -0.194 -0.194 -0.194 -0.194 -0.194 ...
$ Mean_wind : num 0.836 0.836 0.836 0.836 0.836 ...
$ Mean_temp : num -0.427 -0.427 -0.427 -0.427 -0.427 ...
$ Day : num -0.993 -0.993 -0.993 -0.993 -0.993 ...
$ Artificial_light: num -0.2016 -0.2016 0.0772 -0.2016 -0.2016 ...
$ WBdi : num 1.14 1.14 1.14 1.14 1.14 ...
$ WCdi : num 1.49 1.49 1.49 1.49 1.47 ...
... (many more fixed-effect variables)
Run Code Online (Sandbox Code Playgroud)
响应变量是计数(RHI_counts_12)。
我的问题是关于模型中随机效应变量的结构。我有2个分类随机效应变量(“站点”和“位置”;“位置”嵌套在“站点”中)和5个数字随机效应变量。我已经像这样构造了模型(仅使用固定效应变量的一个样本):
lasso1<-glmmLasso(RHI_counts_12 ~ Artificial_light+WBdi+WCdi+BUdi+FOdi+TIdi, list(Site=~1,Location=~1+Dist_roost+Natural_light+Mean_wind+Mean_temp+Day),
lambda = 500,family = poisson(link = log), data = RHI_12)
Run Code Online (Sandbox Code Playgroud)
如果我拥有这2个类别的嵌套随机效应,那么我完全不相信构造随机效应的正确方法。我想在Site中嵌套一个具有Location的模型,但我不认为这就是我得到的。这是我的随机效果输出(在此输出中,“ Loc”代表位置,“ siteName”代表Site):
Random Effects:
StdDev:
[[1]]
siteName
siteName 1.180514
[[2]]
Loc Loc:Dist_roost Loc:Natural_light Loc:Mean_wind
Loc 1.15105859 -0.66317669 -0.35354821 -0.10805268
Loc:Dist_roost -0.66317669 1.42601945 0.46004662 -0.42795987
Loc:Natural_light -0.35354821 0.46004662 0.49532786 -0.15485395
Loc:Mean_wind -0.10805268 -0.42795987 -0.15485395 0.76175417
Loc:Mean_temp 0.02677276 0.03961902 -0.01431360 -0.03649499
Loc:Day 0.03756960 -0.02081360 0.02520654 -0.12082652
Loc:Mean_temp Loc:Day
Loc 0.02677276 0.03756960
Loc:Dist_roost 0.03961902 -0.02081360
Loc:Natural_light -0.01431360 0.02520654
Loc:Mean_wind -0.03649499 -0.12082652
Loc:Mean_temp 0.36923939 -0.08311209
Loc:Day -0.08311209 0.56876662
Run Code Online (Sandbox Code Playgroud)
您认为对吗?我无法使用嵌套在“站点”中的“位置”来构建该模型(所有其他随机因素也将嵌套在“站点”中。)我尝试了许多不同的方法,但均未成功。
我已经非常感谢您阅读我的内容以及对glmmLasso中随机效果的结构的任何建议!:-)
汤玛士