小编Rco*_*fee的帖子

Zeroinfl“系统在计算上是奇异的”,而预测变量没有相关性

我正在尝试对一年中工人缺勤天数的计数数据(因变量)进行建模。我有一组预测变量,包括有关工人、有关他们的工作等的信息,其中大多数是分类变量。因此,需要估计大量系数 (83),但由于我有超过 600 000 行,我认为这应该不会有问题。此外,我的数据集中没有缺失值。

我的因变量包含很多零值,所以我想使用包zeroinfl的函数来估计零膨胀模型(泊松或负二项式) pscl,代码如下:

zpoisson <- zeroinfl(formule,data=train,dist = "poisson",link="logit")
Run Code Online (Sandbox Code Playgroud)

但长时间运行后出现以下错误:

Error in solve.default(as.matrix(fit$hessian)) : system is computationally singular: reciprocal condition number = 1.67826e-41
Run Code Online (Sandbox Code Playgroud)

我认为这个错误意味着我的一些协变量是相关的,但在检查成对相关性和方差膨胀因子(VIF)时似乎并非如此。此外,我还估计了其他模型,如 logit 和 Poisson 或负二项式计数模型,没有出现问题,而这些类型的模型对相关预测变量也很敏感。

您知道为什么该zeroinfl功能不起作用吗?这是否与我有太多的预测变量有关,即使它们不相关?我已经尝试使用该Boruta算法删除一些预测变量,但它保留了所有预测变量。

在此先感谢您的帮助。

regression r poisson singular

5
推荐指数
1
解决办法
2952
查看次数

标签 统计

poisson ×1

r ×1

regression ×1

singular ×1