Use*_*953 9 image machine-learning deep-learning convolutional-neural-network
我们正在与一家拥有超过 200 万张 jpeg 图像的公司合作。他们想收集更多的图像。图像的目的是机器分类并找到螺栓和小漏水等小物体。图像数量很多,但训练的例子很少,可能只有 100 个或更少的样本。
我们对公司的建议是以未压缩的原始 10 或 12 位 png/tiff 格式存储数据。他们想要使用 jpeg 格式,因为他们可以在更短的时间内收集更多数据(每秒 4 张图像)并且不需要所有磁盘空间。
有谁知道与 png 格式相比,jpeg 的存储将如何影响样本的训练以及稍后的查找/分类?
我已经用谷歌搜索过。它返回了许多关于如何使用深度学习提高 jpeg 质量的答案。其余的答案是关于如何使用互联网上的库来处理猫和狗。有一篇文章说 jpeg 压缩会影响识别,但很少涉及什么样的图像,你要寻找什么类型的对象等。
当您寻找像狗和猫这样的大型物体时,您将拥有许多可以使用的特征、曲线、颜色、直方图和其他特征。寻找具有很少特征的非常小的对象更为复杂。
有谁知道关于这个主题的任何文章?关键问题:我应该将图像存储在 png 或无损 tiff 中,还是可以使用 jpeg 压缩以供以后在深度学习中使用?
小智 6
TL;DR:是的,但没有那么多。除非您考虑 <10 JPEG 质量参数,否则您应该是安全的。
更长的版本:
我强烈推荐一篇名为“ 理解图像质量如何影响深度神经网络”的文章。正如您可能猜到的,作者检查了不同的失真(JPEG、JPEG 2000、模糊和噪声)如何影响常用 CNN 架构(VGG、AlexNet、GoogLeNet)的性能。
显然,所有经过测试的网络都以类似的方式运行,只有严重的 JPEG 压缩(质量 < 10)才会对它们造成伤害。
唯一的问题是 ResNet 系列中没有任何内容经过测试,但我不明白为什么它会大不相同。
如果数据相同,那么以什么格式存储并不重要。但当然,Jpeg 是有损的,可能会丢失一些信息,这可能会降低精度(但不会产生重大变化),这也可能是由于随机权重初始化造成的
但这应该不重要,因为损失并不算太大,而且图像仍然可以被人眼识别。事实上,如果有这么多图像,也许 jpeg 是更好的存储方式,因为它占用的空间更少。
| 归档时间: |
|
| 查看次数: |
3975 次 |
| 最近记录: |