深度学习与Caffe一起训练数据集

Question

我是一个深度学习的新手,正致力于使用Caffe为图像创建车辆分类器,并有一个由3个部分组成的问题:

组织培训CNN的课程是否有最佳实践？即每个班级的班级数量和样本数量？例如,我会以这种方式变得更好:
- (a)车辆 - 轿车 - 轿车/汽车 - 两厢车/轿车 - SUV /卡车 - 18轮/ ....(注意这可能意味着几千个级别),或者
- (b)有一个更高级别的模型,在汽车/卡车/ 2轮车等之间进行分类......如果是汽车类型,则查询汽车模型以获得汽车类型
  (轿车/两厢车等)
每节课有多少训练图像是典型的最佳实践？我知道有几个其他变量会影响CNN的准确性,但是在每个班级中,有哪些粗略的数字可以拍摄？它应该是模型中类的数量的函数吗？例如,如果我的模型中有很多类,我应该为每个类提供更多样本吗？
我们如何确保我们不会过分适应课堂？有没有办法测量一类训练样本的异质性？

提前致谢.

Answer 1

那么,你提到的第一个选择对应于计算机视觉社区中一项非常具有挑战性的任务:细粒度的图像分类,你想要对基类的下属进行分类,比如Car!要获得更多信息这,你可能会看到这个文件.根据关于图像分类的文献,对CNNs进行学习等高级课程(如汽车/卡车)的分类会更加简单,因为可能存在更多的歧视性特征.我建议采用第二种方法,即对所有类型的汽车与卡车等进行分类.
训练样本的数量主要与参数的数量成比例,即如果您想训练浅模型,则需要更少的样本.这还取决于您决定微调预先训练的模型或从头开始训练网络.如果没有足够的样本,则必须对任务中的模型进行微调.
过度拟合的摔跤一直是机器学习中的一个问题,甚至CNN也不是免费的.在文献中,已经引入了一些实用的建议来减少过度拟合的发生,例如丢失层和数据增强过程.

可能不包括在您的问题中,但似乎您应该遵循微调程序,即在另一个任务(例如ILSVRC 201X)上使用预先计算的模型权重初始化网络,并根据您的新任务调整权重.该过程在社区中称为转移学习(有时是域适应).