使用Keras评估模型时的测试分数与测试准确性

Ste*_*son 13 neural-network keras

我使用Keras库实现的神经网络,以及下面的训练结果.最后,它打印测试分数和测试准确性.我无法确切地知道得分代表什么,但我认为准确度是运行测试时正确的预测数量.

Epoch 1/15 1200/1200 [==============================] - 4s - 损失:0.6815 - acc:0.5550 - val_loss:0.6120 - val_acc:0.7525

Epoch 2/15 1200/1200 [==============================] - 3s - 损失:0.5481 - acc:0.7250 - val_loss:0.4645 - val_acc:0.8025

Epoch 3/15 1200/1200 [==============================] - 3s - 损失:0.5078 - acc:0.7558 - val_loss:0.4354 - val_acc:0.7975

Epoch 4/15 1200/1200 [==============================] - 3s - 损失:0.4603 - acc:0.7875 - val_loss:0.3978 - val_acc:0.8350

Epoch 5/15 1200/1200 [==============================] - 3s - 损失:0.4367 - acc:0.7992 - val_loss:0.3809 - val_acc:0.8300

Epoch 6/15 1200/1200 [==============================] - 3s - 损失:0.4276 - acc:0.8017 - val_loss:0.3884 - val_acc:0.8350

Epoch 7/15 1200/1200 [==============================] - 3s - 损失:0.3975 - acc:0.8167 - val_loss:0.3666 - val_acc:0.8400

Epoch 8/15 1200/1200 [==============================] - 3s - 损失:0.3916 - acc:0.8183 - val_loss:0.3753 - val_acc:0.8450

Epoch 9/15 1200/1200 [==============================] - 3s - 损失:0.3814 - acc:0.8233 - val_loss:0.3505 - val_acc:0.8475

Epoch 10/15 1200/1200 [==============================] - 3s - 损失:0.3842 - acc:0.8342 - val_loss:0.3672 - val_acc:0.8450

Epoch 11/15 1200/1200 [==============================] - 3s - 损失:0.3674 - acc:0.8375 - val_loss:0.3383 - val_acc:0.8525

Epoch 12/15 1200/1200 [==============================] - 3s - 损失:0.3624 - acc:0.8367 - val_loss:0.3423 - val_acc:0.8650

Epoch 13/15 1200/1200 [==============================] - 3s - 损失:0.3497 - acc:0.8475 - val_loss:0.3069 - val_acc:0.8825

Epoch 14/15 1200/1200 [==============================] - 3s - 损失:0.3406 - acc:0.8500 - val_loss:0.2993 - val_acc:0.8775

Epoch 15/15 1200/1200 [==============================] - 3s - 损失:0.3252 - acc:0.8600 - val_loss:0.2960 - val_acc:0.8775

400/400 [==============================] - 0s

考试成绩:0.299598811865

测试精度:0.88

看看Keras文档,我仍然不明白得分是多少.对于评估功能,它说:

返回测试模式下模型的损失值和度量值.

我注意到的一件事是,当测试精度较低时,分数较高,而当准确度较高时,分数较低.

小智 17

供参考,代码的两个相关部分:

model.compile(loss='binary_crossentropy',
              optimizer='adam',
              metrics=['accuracy'])

score, acc = model.evaluate(x_test, y_test,
                            batch_size=batch_size)
print('Test score:', score)
print('Test accuracy:', acc)
Run Code Online (Sandbox Code Playgroud)

分数是对给定输入的损失函数的评估.

培训网络正在寻找最小化损失函数(或成本函数)的参数.

这里的成本函数是binary_crossentropy.

对于目标T和网络输出O,二进制交叉熵可以定义为

f(T,O)= - (T*log(O)+(1-T)*log(1-O))

所以你看到的分数就是对它的评价.

如果你给它输入一批输入,它很可能会返回平均损失.

所以,是的,如果你的模型具有较低的损失(在测试时),它通常应该具有较低的预测误差.

  • 您也可以通过这种方式执行“得分,acc = model.evaluate(x,y,详细= 0)”,这样就不会重印时代 (2认同)

Pra*_*een 5

训练过程中经常使用损失来找到模型的“最佳”参数值(例如神经网络中的权重)。这是您在训练中尝试通过更新权重来优化的内容。

准确性更多的是从应用的角度来看。找到上述优化参数后,您可以使用此指标来评估模型预测与真实数据相比的准确性。

这个答案提供了详细信息:

如何解释机器学习模型的“损失”和“准确性”