有什么方法可以train()使用数据的自定义训练/测试分区来运行吗?我对回测时间序列数据感兴趣(当传统的重采样/CV/等不合适/泄漏时)。即,如果数据按时间从 1...N 排序,那么我会在某个截止值之前重复训练数据,以预测截止值之后的数据(直到某个滑动窗口大小)。我无法确定如何在利用插入符号的其余部分的同时实现这一点train()。预先感谢您的任何提示。
麦克斯在这里。
您可以在 trainControl(index = list()) 中指定自定义重采样索引,其中列表包含用于训练的训练数据的元素。
...但是 train() 会使用其他所有东西作为保留,我认为这不是你想要的。
我可能收到过大约 10 个对此功能的不同请求。需要对 train() 进行一些修改才能做到这一点,但这应该不会太糟糕。
然而,1)我不了解杰克时间序列分析(除了简单的基础知识),所以一些带有一两个测试示例的原型代码会很有帮助,2)直到我完成这本书(大约 4 个月)我才真正了解有时间做这件事。
因此,如果您愿意贡献一些技术,并且可以等待几个月(可以根据您的积极主动程度来减少),则可以通过一些修改来完成。
如果您想进一步讨论,请给我发送电子邮件至包裹上列出的地址。