当使用 TensorFlowtf.data.experimental.sample_from_datasets从两个非常不平衡的数据集中进行同等采样时,我最终收到了DirectedInterleave selected an exhausted input: 0警告。基于此 GitHub 问题,当其中的一个数据集sample_from_datasets已耗尽示例时,似乎会发生这种情况,并且需要对已经看到的示例进行采样。
耗尽的数据集是否仍然产生样本(从而保持所需的平衡训练比率),或者数据集是否没有采样,因此训练再次变得不平衡?如果是后者,是否有一种方法可以产生所需的平衡训练比率sample_from_datasets?
注意:正在使用 TensorFlow 2 Beta