我正在寻找一种方法来以编程方式识别图像是否可能是照片与插图/徽标/图表。图像始终是 JPEG,因此我无法单独使用格式元数据来区分(我也考虑过使用尺寸,但这对我正在处理的场景没有帮助,因为它们都是一个类似的比例,它们通常也已经被剥夺了相机元数据)。
具体来说,我想要一种方法来筛选出我遇到的 <10% 的非照片图像,尽管该方法不需要完全证明(如果它能工作 10 次中有 9 次,那将是一个重大改进超过什么都不做)。
我不介意解决方案使用什么编程语言或平台。能够使用现有的高级库或易于实现(即尽可能少的 LoC;)可以用多种语言复制的低级方法将是理想的。我也很高兴有人指出这样做的开源项目的例子,即使他们所做的很糟糕。
我在寻找执行此操作的技术方面运气不佳。我注意到许多搜索引擎在搜索图像时提供了此选项,并取得了不同程度的成功。
注意:我从各种来源获取现有图像,这是出于研发目的,并且符合当地版权法(在任何人提出要求之前)。
如果没有任何库可以做到这一点,我可能最终会写一个(也许根据最大独特颜色、实心色块等估计概率),但我希望有人已经发布了一些可用于此目的的东西,而我只是还没有没找到!