加权样本的弹性净回归或套索回归(sklearn)

Alb*_*eit 5 python regression linear-regression scikit-learn

Scikit-learn允许将样本权重提供给线性,逻辑和岭回归(以及其他),但不能提供给弹性净或套索回归。通过样本权重,我的意思是要拟合的输入的每个元素(以及相应的输出)的重要性都在变化,并且应该对与权重成正比的估计系数产生影响。

在将数据传递给ElasticNet.fit()合并样本权重之前,有什么方法可以处理?

如果不是,是否有根本原因是不可能的?

谢谢!

sas*_*cha 6

您可以在sklearn的问题跟踪器中阅读有关此问题的一些讨论。

它基本上是这样的:

  • 不难做到(理论上)
  • 保持所有基本sklearn'API并支持所有可能的情况(密集与稀疏)的痛苦

正如您在该线程以及有关自适应套索链接线程中所看到的那样,那里没有太多活动(可能是因为没有多少人关心,并且相关论文不够流行;但这只是一个猜测)。

根据您的确切任务(大小?稀疏性?),您可以基于scipy.optimize轻松构建自己的优化器,并支持这种样本权重(虽然速度稍慢,但功能强大且精确)!