小图像数据集的数据增强技术?

whi*_*ker 15 machine-learning image-processing computer-vision neural-network deep-learning

目前我正在培训类似于Flickrlogos-32的小型徽标数据集,其中包含深度CNN.为了训练更大的网络,我需要更多的数据集,因此使用扩充.我现在做的最好的是使用仿射变换(特征标准化,特征中心,旋转,宽度高度偏移,水平垂直翻转).但对于更大的网络,我需要更多的扩充.我试着在kaggle的国家数据科学碗论坛上搜索,但无法得到很多帮助.还有对于给定的一些方法的代码在这里,但我不知道这可能是有用的.除了仿射变换之外,还有哪些其他(或更好)的图像数据增强技术可应用于此类(或任何一般图像)数据集?

del*_*eil 16

可以在这里找到一个很好的回顾,第1节关于数据增强:即翻转,随机作物颜色抖动以及照明噪声:

Krizhevsky等.在2012年训练着名的Alex-Net时提出了花哨的PCA.Fancy PCA改变了训练图像中RGB通道的强度.

另外,您还可以看看Kaggle Galaxy Zoo的挑战:获奖者写了一篇非常详细的博客文章.它涵盖了相同的技术:

  • 回转,
  • 翻译,
  • 放大,
  • 翻转,
  • 色彩扰动.

如上所述,他们也"实时地,即在训练期间".

例如,这是一个由Facebook 实施的实用Torch (用于ResNet培训).


Mar*_*oma 5

我在我的硕士论文中收集了一些增强技术,第 80 页。这包括:

  • 飞涨,
  • 庄稼
  • 翻转(水平/垂直)
  • 回转
  • 缩放
  • 剪切
  • 频道转换(RGB、HSV)
  • 对比
  • 噪音,
  • 渐晕