相关疑难解决方法(0)

`Dataset.from_tensors`和`Dataset.from_tensor_slices`之间的区别？

我有一个数据集表示为NumPy形状矩阵,(num_features, num_examples)我希望将其转换为TensorFlow类型tf.Dataset.

我正在努力去理解这两种方法之间的区别:Dataset.from_tensors和Dataset.from_tensor_slices.什么是正确的,为什么？

TensorFlow文档(链接)表示两种方法都接受张量的嵌套结构,尽管使用from_tensor_slices张量时在第0维应该具有相同的大小.

python tensorflow tensorflow-datasets

Lle*_*lyn

2019 10-30

32
推荐指数

5
解决办法

1万
查看次数

Tensorflow:在cpu上的多个线程中加载数据

我有一个python类SceneGenerator,它有多个成员函数用于预处理和生成器函数generate_data().基本结构是这样的:

class SceneGenerator(object):
    def __init__(self):
       # some inits

    def generate_data(self):
        """
        Generator. Yield data X and labels y after some preprocessing
        """
        while True:
            # opening files, selecting data
            X,y = self.preprocess(some_params, filenames, ...)            

            yield X, y

Run Code Online (Sandbox Code Playgroud)

我在keras model.fit_generator()函数中使用了类成员函数sceneGenerator.generate_data()来从磁盘读取数据,对其进行预处理并将其生成.在keras中,如果workers参数of model.fit_generator()设置为> 1 ,则在多个CPU线程上完成.

我现在想SceneGenerator在tensorflow中使用相同的类.我目前的做法是:

sceneGenerator = SceneGenerator(some_params)
for X, y in sceneGenerator.generate_data():

    feed_dict = {ops['data']: X,
                 ops['labels']: y,
                 ops['is_training_pl']: True
                 }
    summary, step, _, loss, prediction = sess.run([optimization_op, loss_op, pred_op],
                                                  feed_dict=feed_dict)

Run Code Online (Sandbox Code Playgroud)

但是,这很慢并且不使用多个线程.我发现 …

python multithreading keras tensorflow

Mer*_*896

2017 12-14

9
推荐指数

1
解决办法

3380
查看次数