我正在使用来自scikit-learn的StratifiedKFold,但现在我还要注意"团体".有很好的功能GroupKFold,但我的数据非常依赖于时间.与帮助中的相似,即周数是分组索引.但每周应该只有一个折叠.
假设我需要10倍.在我可以使用GroupKFold之前,我需要先将数据混洗.
洗牌是小组的 - 所以整个小组应该互相洗牌.
有办法做的是scikit - 以某种方式学习优雅吗?在我看来,GroupKFold首先可以自动调整数据.
如果没有办法用scikit做,有人可以写一些有效的代码吗?我有大量的数据集.
矩阵,标签,组作为输入