使用自定义目标/损失函数的随机森林回归器(Python/Sklearn)

vis*_*may 7 poisson python-3.x random-forest scikit-learn statsmodels

我想构建一个随机森林回归器来模拟计数数据(泊松分布)。默认的“mse”损失函数不适合这个问题。有没有办法定义自定义损失函数并将其传递给 Python 中的随机森林回归器(Sklearn 等)?

是否有任何实现可以在任何包中拟合 Python 中的计数数据?

Mar*_* V. 8

在 sklearn 中,目前不支持此功能。请参阅此处相应问题中的讨论,或者另一个类的讨论,其中他们更详细地讨论了其原因(主要是调用 Python 函数的大量计算开销)。

因此,可以按照问题中讨论的方式完成,通过分叉 sklearn,在 Cython 中实现成本函数,然后将其添加到可用“标准”列表中。