错误:PerfectSeparationError:检测到完美分离,结果不可用

Dip*_*jee 8 python logistic-regression

这是火车数据集的头部。

X_Train 的负责人

运行以下代码:

logit = sm.GLM(Y_train, X_train, family=sm.families.Binomial())
result = logit.fit()
Run Code Online (Sandbox Code Playgroud)

你能帮忙吗?

收到以下错误: 错误屏幕截图

Rob*_*rtF 9

Python 在您的一个或多个预测变量和结果变量中检测到完全或准完全分离。

当一个预测变量类别(或预测变量的组合)中的所有或几乎所有值仅与二元结果值之一相关时,就会发生这种情况。(我假设您正在尝试逻辑回归。)发生这种情况时,无法找到预测系数的解决方案。

有几种可能的解决方案。根据分析中有多少变量,您可以尝试对结果和每个预测变量运行双向交叉表,以定位具有零观察值的任何单元格,然后从分析中删除该变量或使用较少的类别。另一种选择是运行 Firth 逻辑回归或惩罚回归。