TensorFlow:将 tf.Dataset 转换为 tf.Tensor

Viv*_*ian 5 python dataset tensorflow tensorflow-datasets tensorflow2.0

我想生成 10 范围内的窗口:

import tensorflow as tf

dataset = tf.data.Dataset.from_tensor_slices(tf.range(10))
dataset = dataset.window(5, shift=1, drop_remainder=True)
Run Code Online (Sandbox Code Playgroud)

并想在这个数据集上训练我的模型。

为此,必须将这些窗口转换为张量。但这些窗口的数据类型无法转换tf.convert_to_tensor为张量。这是可以做到的tf.convert_to_tensor(list(window)),但是效率很低。

有谁知道如何tf.VariantDataset有效地将 a 转换为 a tf.Tensor

感谢您的帮助!

jde*_*esa 2

如果你想创建一个滑动窗口张量,通过数据集来完成它并不是最好的方法,效率和灵活性都低得多。我认为没有适当的操作,但是对于 2D 和 3D 数组有两个类似的操作,tf.image.extract_patches并且tf.extract_volume_patches. 您可以重塑一维数据以使用它们:

import tensorflow as tf

a = tf.range(10)
win_size = 5
stride = 1
# Option 1
a_win = tf.image.extract_patches(tf.reshape(a, [1, -1, 1, 1]),
                                 sizes=[1, win_size, 1, 1],
                                 strides=[1, stride, 1, 1],
                                 rates=[1, 1, 1, 1],
                                 padding='VALID')[0, :, 0]
# Option 2
a_win = tf.extract_volume_patches(tf.reshape(a, [1, -1, 1, 1, 1]),
                                  ksizes=[1, win_size, 1, 1, 1],
                                  strides=[1, stride, 1, 1, 1],
                                  padding='VALID')[0, :, 0, 0]
# Print result
print(a_win.numpy())
# [[0 1 2 3 4]
#  [1 2 3 4 5]
#  [2 3 4 5 6]
#  [3 4 5 6 7]
#  [4 5 6 7 8]
#  [5 6 7 8 9]]
Run Code Online (Sandbox Code Playgroud)