有没有办法在 tf.data.Dataset w/tf.py_func 中传递字典?

Hon*_*Lee 6 python tensorflow tensorflow-datasets

我在数据处理中使用 tf.data.Dataset,我想用 tf.py_func 应用一些 python 代码。

顺便说一句,我发现在 tf.py_func 中,我无法返回字典。有没有办法做到这一点或解决方法?

我有如下所示的代码

def map_func(images, labels):
    """mapping python function"""
    # do something
    # cannot be expressed as a tensor graph
    return {
        'images': images,
        'labels': labels,
        'new_key': new_value}
def tf_py_func(images, labels):
    return tf.py_func(map_func, [images, labels], [tf.uint8, tf.string], name='blah')

return dataset.map(tf_py_func)
Run Code Online (Sandbox Code Playgroud)

================================================== ==========================

已经有一段时间了,我忘记我问过这个问题了。我以另一种方式解决了它,它是如此简单,以至于我觉得我几乎是个傻瓜。问题是:

  1. tf.py_func 不能返回字典。
  2. dataset.map 可以返回字典。

答案是:映射两次。

def map_func(images, labels):
    """mapping python function"""
    # do something
    # cannot be expressed as a tensor graph
    return {
        'images': images,
        'labels': labels,
        'new_key': new_value}
def tf_py_func(images, labels):
    return tf.py_func(map_func, [images, labels], [tf.uint8, tf.string], name='blah')

return dataset.map(tf_py_func)
Run Code Online (Sandbox Code Playgroud)

小智 2

您可以将字典转换为返回的字符串,然后将其拆分为字典。

这可能看起来像这样:

return (images + " " + labels + " " + new value)
Run Code Online (Sandbox Code Playgroud)

然后在你的其他函数中:

l = map_func(image, label).split(" ")
d['images'] = l[0]
d[
...
Run Code Online (Sandbox Code Playgroud)