当他们是Caffe和Theano的时候,我正在努力学习(和比较)不同的深度学习框架.
http://caffe.berkeleyvision.org/gathered/examples/mnist.html
和
http://deeplearning.net/tutorial/lenet.html
我按照教程在MNIST数据集上运行这些框架.但是,我注意到在准确性和性能方面存在很大差异.
对于Caffe来说,它的准确度非常快,可以达到~97%.事实上,完成程序只需5分钟(使用GPU),测试集的最终精度超过99%.真是太棒了!
然而,在Theano上,它更加贫穷.我花了超过46分钟(使用相同的GPU),只是为了达到92%的测试性能.
我很困惑,因为在同一数据集上运行相对相同的架构的框架之间不应该有太大的区别.
所以我的问题是.Caffe报告的准确度数字是测试集上正确预测的百分比吗?如果是这样,是否有任何解释的差异?
谢谢.