如何找到每个系数的p值(显着性)?
lm = sklearn.linear_model.LinearRegression()
lm.fit(x,y)
Run Code Online (Sandbox Code Playgroud) 我试图用SKLearn做一个LR,用于一个相当大的数据集,其中有600个虚拟数据集,只有很少的区间变量(我的数据集中有300 K行),结果混淆矩阵看起来很可疑.我想检查返回系数和ANOVA的重要性,但我找不到如何访问它.有可能吗?对于包含大量虚拟变量的数据,最佳策略是什么?非常感谢!
我是机器学习的新手,并使用 sklearn 创建了一个逻辑模型,但我没有获得任何有关如何查找特征变量和模型的 P 值的文档。我已经检查了堆栈链接,但没有得到所需的输出。请帮忙。提前致谢
scikit-learn ×3
anova ×1
dummy-data ×1
numpy ×1
python ×1
python-2.7 ×1
regression ×1
statistics ×1