hsh*_*hed 5 python svm sparse-matrix scikit-learn
我在python中使用sklearn svr包实现SVR.我的稀疏矩阵的大小为146860 x 10202.我已将其划分为大小为2500 x 10202的各种子矩阵.对于每个子矩阵,SVR拟合大约需要10分钟.有什么方法可以加快这个过程?请建议任何不同的方法或不同的python包相同.谢谢!
您可以平均SVR子模型预测.
或者,您可以尝试在使用Nystroem方法计算的内核扩展的输出上拟合线性回归模型.
或者您可以尝试其他非线性回归模型,例如随机树集合或梯度增强回归树.
编辑:我忘了说:内核SVR模型本身不可扩展,因为它的复杂性超过二次,因此没有办法"加速".
编辑2:实际上,经常将输入变量缩放到[0, 1]或者[-1, 1]使用单位方差StandardScaler可以加快收敛速度.
此外,默认参数不太可能产生良好的结果:在适合大型模型之前,您必须网格搜索最佳值,gamma也可能还要epsilon增加大小的子样本(以检查最佳参数的稳定性).
| 归档时间: |
|
| 查看次数: |
3111 次 |
| 最近记录: |