Logistic glmer{lme4} 模型尽管非常简单，但仍是奇异的

Question

Logistic glmer{lme4} 模型尽管非常简单，但仍是奇异的

eli*_*isa 5 regression r lme4 mixed-models logistic-regression

我正在尝试运行一个相对简单的 glmer 模型，并收到警告说它是奇异的，但我不明白为什么。

在我的数据集中，40 名参与者进行了 108 次试验。他们回答了一个问题（回答被编码为正确/不正确 - 0/1），并以从 0 到 1 的连续等级对他们的回答的置信度进行评分。

library(lme4)
library(tidybayes)
library(tidyverse)

set.seed(5)
n_trials = 108
n_subjs = 40
data =
  tibble(
    subject = as.factor(rep(c(1:n_subjs), n_trials)),
    correct = sample(c(0,1), replace=TRUE, size=(n_trials*n_subjs)),
    confidence = runif(n_trials*n_subjs)
  )

Run Code Online (Sandbox Code Playgroud)

我正在尝试运行混合效应逻辑回归，以估计每个参与者仅将高置信度与正确响应相关联的能力。这意味着，我有充分的理由在我的模型中添加随机置信斜率。

我感兴趣的最简单的模型给了我：

model = glmer(correct ~ confidence + (confidence|subject) , 
                   data = data,  
                   family = binomial)

Run Code Online (Sandbox Code Playgroud)

边界（奇异）拟合：参见 ?isSingular，以及

> isSingular(model)
[1] TRUE

Run Code Online (Sandbox Code Playgroud)

所以我简化了模型，超出了实用性，并遇到了同样的问题：

model = glmer(correct ~ confidence + (1|subject) , 
              data = data,  
              family = binomial)

Run Code Online (Sandbox Code Playgroud)

我试图保持信心（我确信有更优雅的方法），以防有帮助，但没有：

#Initialize as vector of 0s
data$confidence_binned <- numeric(dim(data)[1])
nbins = 4
bins=seq(0,1,length.out = (nbins+1))
for (b in 1:(length(bins)-1)) {
  data$confidence_binned[data$confidence>=bins[b] & data$confidence<bins[b+1]] = b
}
data$confidence_binned[data$confidence_binned==1]=nbins


model = glmer(correct ~ confidence_binned + (confidence_binned|subject) , 
              data = data,  
              family = binomial)

Run Code Online (Sandbox Code Playgroud)

边界（奇异）拟合：参见 ?isSingular

关于警告有很多帖子和问题isSingular，但我发现的所有帖子和问题都说模型对于数据来说太复杂，解决方案通常是“保持最大”。然而，这个模型非常简单，而且我很困惑的是，经过足够多的试验（听起来像是），它仍然失败了。

我也尝试过更改控制器，但没有帮助：

ctrl = glmerControl(optimizer = "bobyqa",
                    boundary.tol = 1e-5,
                    calc.derivs=TRUE,
                    use.last.params=FALSE,
                    sparseX = FALSE,
                    tolPwrss=1e-7,
                    compDev=TRUE,
                    nAGQ0initStep=TRUE, 
                    ## optimizer args
                    optCtrl = list(maxfun = 1e5))

model  <- glmer(correct ~ confidence_binned + (confidence_binned|subject), 
                data=data, 
                verbose=T, 
                control=ctrl,
                family = binomial)

Run Code Online (Sandbox Code Playgroud)

任何关于在数据中寻找什么的帮助或指示都值得赞赏。

编辑回应评论：结果ggplot(data,aes(x=subject, y=correct)) + stat_summary(fun.data=mean_cl_normal)

Answer 1

Sha*_*and 1

众所周知，具有随机斜率和随机截距相关的 GLMM（又称最大模型）即使在拟合良好的数据下也很难拟合，尽管有些人提倡这种方法。除非您看到随机斜率预测因子存在一些严重波动的主题或项目方差，否则我最好的建议是拟合仅随机截距模型，看看它是否更适合。

对于这个主题有截然不同观点的三篇综合论文，请参见下文。第一篇是一篇经常被引用的关于最大方法的论文。第二个是由创建该lme4包的人编写的，他为简约模型提出了论点。第三篇是本·博克推荐的贝茨的另一篇同行评审论文。

引用：

归档时间：	5 年，4 月前
查看次数：	408 次
最近记录：	3 年，3 月前