使用model.fit_generator时,keras val非常慢

Yan*_*hou 5 python deep-learning keras resnet

当我使用我的数据集基于Keras的Resnet-50(后端是张量流)时,我发现很奇怪,在每个时代之后,val比火车慢.我不知道为什么,是因为我的GPU没有足够的内存?我的GPU是K2200,有4 GB内存.我是否误解了这段话的意思?

我有35946火车图片所以我使用:

samples_per_epoch=35946,
Run Code Online (Sandbox Code Playgroud)

我有8986 val pic所以我使用:

 nb_val_samples=8986,
Run Code Online (Sandbox Code Playgroud)

以下是我的代码的一部分:

train_datagen = ImageDataGenerator(
    rescale=1./255,
    featurewise_center=False,  # set input mean to 0 over the dataset
    samplewise_center=False,  # set each sample mean to 0
    featurewise_std_normalization=False,  # divide inputs by std of the dataset
    samplewise_std_normalization=False,  # divide each input by its std
    zca_whitening=False,  # apply ZCA whitening
    rotation_range=20,  # randomly rotate images in the range (degrees, 0 to 180)
    width_shift_range=0.1,  # randomly shift images horizontally (fraction of total width)
    height_shift_range=0.1,  # randomly shift images vertically (fraction of total height)
    horizontal_flip=True,  # randomly flip images
    vertical_flip=False,
    zoom_range=0.1,
    channel_shift_range=0.,
    fill_mode='nearest',
    cval=0.,

)
test_datagen = ImageDataGenerator(rescale=1. / 255)

train_generator = train_datagen.flow_from_directory(
    'data/train',
    batch_size=batch_size,
    class_mode='categorical')

validation_generator = test_datagen.flow_from_directory(
    'data/val',
    batch_size=batch_size,
    class_mode='categorical')
model.fit_generator(train_generator,
                    # steps_per_epoch=X_train.shape[0] // batch_size,
                    samples_per_epoch=35946,
                    epochs=epochs,
                    validation_data=validation_generator,
                    verbose=1,
                    nb_val_samples=8986,
                    callbacks=[earlyStopping,saveBestModel,tensorboard])
Run Code Online (Sandbox Code Playgroud)

sah*_*ahu 1

@Yanning 正如您在评论中提到的那样,第一个纪元很慢,因为 ImageDataGenerator 正在将数据从磁盘读取到 RAM。这部分非常慢。将数据读入 RAM 后,只需将数据从 RAM 读取并传输到 GPU 即可。

因此,如果您的数据集不是很大并且可以放入 RAM,您可以尝试从所有数据集中创建一个 numpy 文件并在开始时读取该数据。这将节省大量磁盘寻道时间。

请查看这篇文章以比较不同操作所需的时间:

每个程序员都应该知道的延迟数字

延迟比较数字

主内存参考 100 ns
从内存中顺序读取 1 MB 250,000 ns
从 SSD 中顺序读取 1 MB 1,000,000 ns
从磁盘顺序读取 1 MB 20,000,000 ns