如何通过 tensorflow 的 tf.data API 加载泡菜文件

Zha*_*hen 6 pickle tensorflow

我的数据存储在磁盘上的多个泡菜文件中。我想使用 tensorflow 的 tf.data.Dataset 将我的数据加载到训练管道中。我的代码是:

def _parse_file(path):
    image, label = *load pickle file*
    return image, label
paths = glob.glob('*.pkl')
print(len(paths))
dataset = tf.data.Dataset.from_tensor_slices(paths)
dataset = dataset.map(_parse_file)
iterator = dataset.make_one_shot_iterator()
Run Code Online (Sandbox Code Playgroud)

问题是我不知道如何实现这个_parse_file功能。此函数的参数path是张量类型。我试过

def _parse_file(path):
    with tf.Session() as s:
        p = s.run(path)
        image, label = pickle.load(open(p, 'rb'))
    return image, label
Run Code Online (Sandbox Code Playgroud)

并收到错误消息:

InvalidArgumentError (see above for traceback): You must feed a value for placeholder tensor 'arg0' with dtype string
     [[Node: arg0 = Placeholder[dtype=DT_STRING, shape=<unknown>, _device="/job:localhost/replica:0/task:0/device:CPU:0"]()]]
Run Code Online (Sandbox Code Playgroud)

在互联网上搜索了一些之后,我仍然不知道该怎么做。我会感谢任何给我提示的人。

Zha*_*hen 3

我自己已经解决了这个问题。我应该像本文档tf.py_func中那样使用。