我有一个4-D numpy数组,第一个维度表示数据集中的图像数量,第二个和第三个维度表示(相等)宽度和高度,第四个维度表示通道数(3)。例如,假设我有4张28 * 28彩色图像,所以我的图像数据如下所示:
X = np.reshape(np.arange(4*28*28*3), (4,28,28,3))
Run Code Online (Sandbox Code Playgroud)
我想为4张图片中的每张图片随机选择16 * 16宽x高的裁剪。至关重要的是,我希望每个图像的裁切是不同的,即我想生成4个随机(x_offset,y_offset)对。最后,我要访问形状数组(4、16、16、3)。
如果我要在for循环中编写此代码,它将类似于以下内容:
x = np.random.randint(0,12,4)
y = np.random.randint(0,12,4)
for i in range(X.shape[0]):
cropped_image = X[i, x[i]:x[i]+16, y[i]:y[i]+16, :]
#Add cropped image to a list or something
Run Code Online (Sandbox Code Playgroud)
但是我想尽可能高效地做到这一点,并且我想知道是否有一种方法可以大步前进和花哨的索引编制。我已经看到了该问题的答案,但无法完全理解如何将stride_tricks之类的东西与第二和第三(宽度和高度)轴上的步幅的随机起点组合在一起。