Ard*_*ian 4 python deep-learning conv-neural-network keras
我们可以使用带有flow_from_directory方法的ImageDataGenerator生成图像数据集.对于调用类的列表,我们可以使用oject.classes.但是,如何调用值列表?我搜索过但仍未发现任何问题.
谢谢 :)
ImageDataGenerator是一个python生成器,它会产生一批数据,其形状与模型输入(如(batch_size,width,height,channels)
)相同.生成器的好处是当您的数据集太大时,您无法将所有数据放入有限的内存中,但是,使用生成器,您每次都可以生成一个批处理数据.和ImageDataGenerator一起使用model.fit_generator(), model.predict_generator()
.
如果要获取数字数据,可以使用next()
生成器的功能:
import numpy as np
data_gen = ImageDataGenerator(rescale = 1. / 255)
data_generator = datagen.flow_from_directory(
data_dir,
target_size=(img_height, img_width),
batch_size=batch_size,
class_mode='categorical')
data_list = []
batch_index = 0
while batch_index <= data_generator.batch_index:
data = data_generator.next()
data_list.append(data[0])
batch_index = batch_index + 1
# now, data_array is the numeric data of whole images
data_array = np.asarray(data_list)
Run Code Online (Sandbox Code Playgroud)
或者,您可以自己使用PIL
和numpy
处理图像:
from PIL import Image
import numpy as np
def image_to_array(file_path):
img = Image.open(file_path)
img = img.resize((img_width,img_height))
data = np.asarray(img,dtype='float32')
return data
# now data is a tensor with shape(width,height,channels) of a single image.
Run Code Online (Sandbox Code Playgroud)
然后,您可以使用此函数循环所有图像以获取数字数据.
请注意,我建议您使用生成器而不是直接获取所有数据,或者,您可能会耗尽内存.