我将我的整个数据集作为元组列表存储在内存中,其中每个元组对应一批固定大小的"N".即
(X [I],标记[I],长度[I])
主要问题:批次间的差异很大.
我正在查看以下数据集API的示例和文档,但无法理解如何为我的案例创建DataSet对象.像Dataset.from_tensor_slices和Dataset.from_tensor这样的API似乎不起作用(抛出广播错误),因为它们要求张量具有相同的形状i,而且批次之间的W是相同的.有没有办法我可以做而不必填充我的批次(使用DataSet.padded_batch)?