视觉识别训练的图像选择

Gro*_*Com 2 image-recognition tensorflow visual-recognition watson

我正在训练分类器以识别图像中的某些对象.我正在使用Watson Visual Recognition API,但我认为同样的问题也适用于其他识别API.

我收集了400张照片 - 比如狗.

在我训练沃森之前,我可以删除可能会丢掉东西的图片.我应该删除以下图片:

  1. 多只狗
  2. 与另一只动物的狗
  3. 与一个人的狗
  4. 一只部分遮盖的狗
  5. 戴眼镜的狗

此外,白色背景上的狗会更好地训练样本吗?

沃森也是负面的例子.猫和其他小动物会成为好的反面例子吗?还有什么?

Pet*_*dis 5

你是对的,这是所有类型的自定义分类器和识别器的一般问题 - 无论是vize.it,clarifai,IBM Watson,还是你自己在caffe中训练神经网络.(按您需要使用的示例图像的数量排序.)

您需要问的重要事项是如何使用分类器?您将为机器提供预测所显示对象的真实图像是什么?作为一般规则,您的训练图像应尽可能与预测时间图像相似 - 包括它们描绘的内容(物种的种类和种类)以及它们如何描绘(例如背景).神经网络是超级强大的,如果你给他们足够的图像,他们甚至会学习困难的情况.

也许你想在用户的文件夹中找到狗图像- 其中包括家庭照片,屏幕截图和文档扫描.反映训练集中的多样性.询问用户是否应将带有其他动物的狗标记为狗照片.

也许你想在荒野照片陷阱上找到狗的图像.只需使用该照片陷阱拍摄的各种图像(或几张照片陷阱,如果它是整个网络).

简而言之 - 将样品图像定制为手头的任务!