我有一个关于reader的randomizationWindow参数的快速问题.它在文档中说它控制了内存中有多少数据 - 但我有点不清楚它对数据随机性的影响.如果训练数据文件以一个数据分布开始,并以另一个完全不同的分布结束,那么设置小于数据大小的随机化窗口会导致提供给训练者的数据不是来自同质分布吗?我只是想仔细检查一下.
当 randomizationWindow 设置为小于整个数据大小的窗口时,整个数据大小被分块为 randomizationWindow 大小的块,并且块的顺序是随机的。然后在每个块内,样本被随机化。
| 归档时间: |
|
| 查看次数: |
188 次 |
| 最近记录: |