如何使用KerasClassifier验证分割并使用scitkit学习GridSearchCV

Tol*_*sch 5 scikit-learn keras data-science tf.keras

我想尝试测试一些超参数,这就是我想使用 GridSearchCV,因为这似乎就是这样做的方法。

但我也想使用验证分割。使用 EarlyStopping 或/和 ReduceLROnPlateau 等回调。所以我的问题是:我如何正确实现 GridSearchCV +validation_split,验证分割中的任何数据都不会用于训练,并且整个训练集都用于训练我的模型?Afaik GridSearchCV 再次分割我剩余的训练数据(即 1-validation_split)并再次分割它?我得到了很高的准确度,但我认为我没有正确分割数据

model = KerasClassifier(build_fn=create_model,verbose=2, validation_split=0.1)
optimizers = ['rmsprop', 'adam']
init = ['glorot_uniform',
        #'normal',
        'uniform',
        'he_normal',
        #'lecun_normal',
        #'he_uniform'
       ]
epochs = [3] #5,8,10,30
batches = [64] #32,64
param_grid = dict(optimizer=optimizers, epochs=epochs, batch_size=batches, init=init)
grid = GridSearchCV(estimator=model, param_grid=param_grid)
grid_result = grid.fit(X_train, Y_train)
Run Code Online (Sandbox Code Playgroud)

Quw*_*Ohi 2

grid.fit()您可以通过向函数传递一个额外的参数来使用自定义的验证数据validation_data=(X_test, Y_test)。该文档指出该grid.fit()函数接受可以传递给model.fit()默认 Keras模型的实际函数的所有有效参数。因此,您可以通过该函数传递验证数据grid.fit()。您还可以在那里传递回调函数。

我在下面添加一个工作代码(应用于 MNIST 数字数据集)。请注意我如何添加验证数据grid.fit()并删除“validation_split”:

import tensorflow as tf
import numpy as np
from tensorflow.keras.wrappers.scikit_learn import KerasClassifier
from sklearn.model_selection import GridSearchCV
from tensorflow.keras.datasets import mnist 
from tensorflow.keras.utils import to_categorical

(X_train, Y_train), (X_test, Y_test) = mnist.load_data()
Y_train = to_categorical(Y_train, 10)
Y_test = to_categorical(Y_test, 10)
X_train = np.expand_dims(X_train, 3)
X_test = np.expand_dims(X_test, 3)

def create_model(optimizer, init):
    model = tf.keras.Sequential([
         tf.keras.layers.Convolution2D(32, 3, input_shape=(28, 28, 1), 
                                       activation='relu', kernel_initializer=init),
         tf.keras.layers.Convolution2D(32, 3, activation='relu',
                                       kernel_initializer=init),
         tf.keras.layers.Flatten(),
         tf.keras.layers.Dense(12, activation='relu', 
                               kernel_initializer=init),
         tf.keras.layers.Dense(10, activation='softmax', 
                               kernel_initializer=init),
    ])
    model.compile(loss='categorical_crossentropy', 
                  optimizer=optimizer, metrics=['accuracy'])
    return model

model = KerasClassifier(build_fn=create_model, verbose=2,)
optimizers = ['rmsprop', 'adam']
init = ['glorot_uniform',
        #'normal',
        'uniform',
        'he_normal',
        #'lecun_normal',
        #'he_uniform'
       ]
epochs = [4,] 
batches = [32, 64] 
param_grid = dict(optimizer=optimizers, nb_epoch=epochs, 
                  batch_size=batches, init=init)

grid = GridSearchCV(estimator=model, param_grid=param_grid)
grid_result = grid.fit(X_train, Y_train, validation_data=(X_test, Y_test))
Run Code Online (Sandbox Code Playgroud)

希望这可以帮助。谢谢。