使用Numba和scikit-learn

mzm*_*mzm 5 python scikit-learn numba

有没有人成功地使用numba和jit compilaition来加速scikit-learn模型.我正在研究的具体模型是回归模型,例如Logistic回归.

我能够使用numba来优化我使用sklearn模型编写的函数,但模型函数本身不受此影响且未经优化,因此不会显着提高速度.有没有办法优化sklearn功能?

任何关于此的信息将非常感激.

And*_*eus 6

Scikit-learn大量使用numpy,其中大部分是用C编写的并且已经编译(因此不符合JIT优化条件).

此外,LogisticRegression模型本质上是具有适当损失函数的LinearSVC.我可能会略有不妥,但无论如何,它使用LIBLINEAR进行求解,这也是一个已编译的C库.

scikit-learn的制造者也大量使用了Pyrex之一的python到编译系统,这再次导致优化的机器编译代码不适合JIT编译.

  • 答案意味着 numba 不会优化 numpy-heavy 代码,这是不正确的。 (2认同)