小编Ste*_*ano的帖子

如何在 tensorflow 数据集中加载 numpy 数组

我正在尝试从 numpy 数组开始在 tensorflow 1.14 中创建一个 Dataset 对象（我有一些无法为这个特定项目更改的遗留代码），但是每次我尝试时我都会将所有内容复制到我的图表上，因此当我创建了一个很大的事件日志文件（在这种情况下为 719 MB）。

最初我尝试使用这个函数“tf.data.Dataset.from_tensor_slices()”，但它不起作用，然后我读到这是一个常见问题，有人建议我尝试使用生成器，因此我尝试使用以下代码，但是我又得到了一个巨大的事件文件（又是 719 MB）

def fetch_batch(x, y, batch):
    i = 0
    while i < batch:
        yield (x[i,:,:,:], y[i])
        i +=1

train, test = tf.keras.datasets.fashion_mnist.load_data()
images, labels = train  
images = images/255

training_dataset = tf.data.Dataset.from_generator(fetch_batch, 
    args=[images, np.int32(labels), batch_size], output_types=(tf.float32, tf.int32), 
    output_shapes=(tf.TensorShape(features_shape), tf.TensorShape(labels_shape)))

file_writer = tf.summary.FileWriter("/content", graph=tf.get_default_graph())

Run Code Online (Sandbox Code Playgroud)

我知道在这种情况下我可以使用 tensorflow_datasets API 并且它会更容易，但这是一个更普遍的问题，它涉及如何创建数据集，而不仅仅是使用 mnist 。你能向我解释我做错了什么吗？谢谢

python tensorflow tensorflow-datasets

Ste*_*ano

2019 11-25

5
推荐指数

1
解决办法

1363
查看次数