ImageDataGenerator：如何将第 4 维添加到 numpy 数组？

Question

ImageDataGenerator：如何将第 4 维添加到 numpy 数组？

Pha*_*ate 5 python numpy deep-learning keras tensorflow

我有以下代码使用 opencv 读取图像并显示它：

import cv2, matplotlib.pyplot as plt
img = cv2.imread('imgs_soccer/soccer_10.jpg',cv2.IMREAD_COLOR)
img = cv2.resize(img, (128, 128))
plt.imshow(img)
plt.show()

Run Code Online (Sandbox Code Playgroud)

我想使用 keras 生成一些随机图像，所以我定义了这个生成器：

image_gen = ImageDataGenerator(rotation_range=15,
                           width_shift_range=0.1,
                           height_shift_range=0.1,
                           shear_range=0.01,
                           zoom_range=[0.9, 1.25],
                           horizontal_flip=True,
                           vertical_flip=False,
                           fill_mode='reflect',
                           data_format='channels_last',
                           brightness_range=[0.5, 1.5])

Run Code Online (Sandbox Code Playgroud)

但是，当我以这种方式使用它时：

image_gen.flow(img)

Run Code Online (Sandbox Code Playgroud)

我收到此错误：

'Input data in `NumpyArrayIterator` should have rank 4. You passed an array with shape', (128, 128, 3))

Run Code Online (Sandbox Code Playgroud)

对我来说似乎很明显：RGB，一个图像，当然是 3 维！我在这里缺少什么？文档说它想要一个 4 维数组，但没有指定我应该在第 4 维中放什么！

而如何4维数组应该进行？我现在有（宽度、高度、通道），这个第 4 维是在开始还是结束？

我对 numpy 也不是很熟悉：如何更改现有的 img 数组以添加第 4 维？

Answer 1

Vla*_*lad 4

使用np.expand_dims()：

import numpy as np
img = np.expand_dims(img, 0)
print(img.shape) # (1, 128, 128, 3)

Run Code Online (Sandbox Code Playgroud)

第一个维度指定图像的数量（在您的情况下为 1 个图像）。

归档时间：	6 年，10 月前
查看次数：	1302 次
最近记录：	6 年，10 月前