在sklearn中,GridSearchCV可以将管道作为参数,通过交叉验证找到最佳估算器.但是,通常的交叉验证是这样的:
为了交叉验证时间序列数据,训练和测试数据经常被拆分为:
也就是说,测试数据应始终领先于训练数据.
我的想法是:
编写我自己的k-fold版本类并将其传递给GridSearchCV,这样我就可以享受管道的便利.问题是让GridSearchCV使用指定的训练和测试数据指数似乎很困难.
写一个新类GridSearchWalkForwardTest,它类似于GridSearchCV,我正在研究源代码grid_search.py并发现它有点复杂.
任何建议都是受欢迎的.
python time-series scikit-learn cross-validation
如果我在终端中启动ipython,当我输入'im'并按TAB时,终端将使用'import'自动完成它,但是当我点击pycharm IDE底部的python console按钮时,当ipython环境显示时,键入'im',按TAB键,它不会自动完成.
在PyCharm中,它使用pydevconsole.py来创建ipython环境,但我不知道如何更改它以启用自动完成.
autocomplete ipython pycharm
autocomplete ×1
cross-validation ×1
ipython ×1
pycharm ×1
python ×1
scikit-learn ×1
time-series ×1