ImageDataGenerator:如何将第 4 维添加到 numpy 数组?

Pha*_*ate 5 python numpy deep-learning keras tensorflow

我有以下代码使用 opencv 读取图像并显示它:

import cv2, matplotlib.pyplot as plt
img = cv2.imread('imgs_soccer/soccer_10.jpg',cv2.IMREAD_COLOR)
img = cv2.resize(img, (128, 128))
plt.imshow(img)
plt.show()
Run Code Online (Sandbox Code Playgroud)

我想使用 keras 生成一些随机图像,所以我定义了这个生成器:

image_gen = ImageDataGenerator(rotation_range=15,
                           width_shift_range=0.1,
                           height_shift_range=0.1,
                           shear_range=0.01,
                           zoom_range=[0.9, 1.25],
                           horizontal_flip=True,
                           vertical_flip=False,
                           fill_mode='reflect',
                           data_format='channels_last',
                           brightness_range=[0.5, 1.5])
Run Code Online (Sandbox Code Playgroud)

但是,当我以这种方式使用它时:

image_gen.flow(img)
Run Code Online (Sandbox Code Playgroud)

我收到此错误:

'Input data in `NumpyArrayIterator` should have rank 4. You passed an array with shape', (128, 128, 3))
Run Code Online (Sandbox Code Playgroud)

对我来说似乎很明显:RGB,一个图像,当然是 3 维!我在这里缺少什么?文档说它想要一个 4 维数组,但没有指定我应该在第 4 维中放什么

如何4维数组应该进行?我现在有(宽度、高度、通道),这个第 4 维是在开始还是结束

我对 numpy 也不是很熟悉:如何更改现有的 img 数组以添加第 4 维?

Vla*_*lad 4

使用np.expand_dims()

import numpy as np
img = np.expand_dims(img, 0)
print(img.shape) # (1, 128, 128, 3)
Run Code Online (Sandbox Code Playgroud)

第一个维度指定图像的数量(在您的情况下为 1 个图像)。