Miminum对Google tensorflow图像分类器的要求

Jab*_*abb 12 classification machine-learning computer-vision neural-network tensorflow

我们计划使用Google Tensorflow构建图像分类器.

我想知道使用卷积深度神经网络训练自定义图像分类器的最小值和最佳要求是什么?

问题具体是:

  • 每个班级应该至少提供多少张图片?
  • 我们需要appx吗?每班提供相同数量的训练图像,或者每班的数量是不同的?
  • 错误图像数据对训练数据的影响是什么?例如,500个网球鞋和50个其他鞋的图像.
  • 是否有可能训练一个比最近发布的初始-v3模型更多类的分类器?让我们说:30.000.

Ian*_*low 7

"每个班级应该至少提供多少张图片?"

取决于你如何训练.

如果从头开始训练新模型,纯粹监督:对于图像数量的经验法则,您可以查看MNIST和CIFAR任务.这些似乎可以正常工作,每班约5,000张图像.如果你是从头开始训练的话.

您可以通过在ImageNet上训练的模型开始来引导您的网络.这个模型已经具有很好的功能,因此它应该能够学习如何在没有很多标记示例的情况下对新类别进行分类.我认为这个研究不足以告诉你具体的数字.

如果使用未标记的数据进行训练,则每个类别可能只有100个标记图像.最近有很多关于这个主题的研究工作,尽管没有像Imagenet这样大的任务扩展.易于实施:

http://arxiv.org/abs/1507.00677
Run Code Online (Sandbox Code Playgroud)

复杂实施:

http://arxiv.org/abs/1507.02672
http://arxiv.org/abs/1511.06390
http://arxiv.org/abs/1511.06440
Run Code Online (Sandbox Code Playgroud)

"我们是否需要为每个班级提供相同数量的培训图像,或者每个班级的数量可以不同?"

它应该适用于每个类的不同数量的示例.

"错误的图像数据对训练数据的影响是什么?例如,500张网球鞋和50张其他鞋子的图像."

您应该使用本文中描述的标签平滑技术:

http://arxiv.org/abs/1512.00567
Run Code Online (Sandbox Code Playgroud)

根据您对标签错误率的估计来平滑标签.

"是否有可能训练一个比最近发布的初始-v3模型更多类的分类器?让我们说:30.000."