Sha*_*oon 2 python neural-network keras tensorflow
训练我的模型的代码是:
from keras.models import Sequential
from keras.layers import Dense
import numpy
import pandas as pd
X = pd.read_csv(
"data/train.csv", header=0, usecols=['Type', 'Age', 'Breed1', 'Breed2', 'Gender', 'Color1', 'Color2', 'Color3', 'MaturitySize', 'FurLength', 'Vaccinated', 'Dewormed', 'Sterilized', 'Health', 'Quantity', 'Fee', 'VideoAmt', 'PhotoAmt'])
Y = pd.read_csv(
"data/train.csv", header=0, usecols=['AdoptionSpeed'])
X = pd.get_dummies(X, columns=["Type", "Breed1",
"Breed2", 'Color1', 'Color2', 'Color3', 'Gender', 'MaturitySize', 'FurLength'])
print(X)
Y = Y['AdoptionSpeed'].apply(lambda v: v / 4)
input_units = X.shape[1]
model = Sequential()
model.add(Dense(input_units, input_dim=input_units, activation='relu'))
model.add(Dense(input_units, activation='relu'))
model.add(Dense(1, activation='sigmoid'))
model.compile(loss='binary_crossentropy',
optimizer='adam', metrics=['accuracy'])
model.fit(X, Y, epochs=250, batch_size=1000)
scores = model.evaluate(X, Y)
Run Code Online (Sandbox Code Playgroud)
我有一个名为test.csv. 我如何针对模型测试该集合以查看我的模型的有效性?
它似乎对训练数据有 97% 的准确率,但我担心它可能会过度拟合。
为了选择最佳模型在测试集上对其进行评估,您应该首先将训练集拆分为训练集和验证集。然后您迭代地训练和验证模型。Kerasfit方法会自动为您执行此操作。
model.fit(X, Y, epochs=250, batch_size=1000, validation_split=0.2)
Run Code Online (Sandbox Code Playgroud)
如您所见,这将分配 20% 的训练集用作模型的验证。
那么,你应该使用 test.csv您仅有文件来衡量您选择的模型有多好。但是,永远不要使用测试集进行模型选择。使用测试集,您可以对模型在现实世界中的表现进行无偏估计。
然后我会加载test.csv文件并使用:
model.evaluate(x=X_test, y=Y_test)
Run Code Online (Sandbox Code Playgroud)
否则,如果您只想对测试集执行推理,您可以执行以下操作:
predictions = model.predict(X_test)
Run Code Online (Sandbox Code Playgroud)
此方法将返回测试集的预测。
| 归档时间: |
|
| 查看次数: |
5997 次 |
| 最近记录: |