如何编写Perl脚本来过滤掉已经过修改的数字图片?

Mik*_*ke 4 regex photoshop perl

昨天晚上睡觉之前,我再次浏览了Learning Perl的Scalar Data部分并看到了以下句子:

能够在字符串中包含任何字符意味着您可以创建,扫描和操作原始二进制数据作为字符串.

一个想法立即打击我,我实际上可以让Perl扫描我存储在硬盘上的图片,以检查它们是否包含Adobe字符串.通过这样做,我可以分辨出哪些已被拍照.所以我尝试实现这个想法并提出以下代码:

#!perl
use autodie;
use strict;
use warnings;

{
    local $/="\n\n";
    my $dir = 'f:/TestPix/';
    my @pix = glob "$dir/*";

    foreach my $file (@pix) {
        open  my $pic,'<',  "$file";

        while(<$pic>) {
            if (/Adobe/) {
                print "$file\n";
            }
        }
    }
}
Run Code Online (Sandbox Code Playgroud)

令人兴奋的是,代码似乎真的很有效,它可以过滤出已经过photoshopped的图片.但问题是许多图片是由其他公用事业编辑的.我想我有点卡在那里.我们是否有一些简单但通用的方法来判断数字图片是否已被编辑,例如

if (!= /the origianl format/) {...}
Run Code Online (Sandbox Code Playgroud)

或者我们只需添加更多条件?喜欢

if (/Adobe/|/ACDSee/|/some other picture editors/)
Run Code Online (Sandbox Code Playgroud)

有什么想法吗?或者由于我的编程知识极其有限,我还是过于简单化了?

一如既往地感谢任何指导.

小智 8

你在Perl中最好的选择可能就是ExifTool.这使您可以访问嵌入到图像中的任何非图像信息.然而,正如其他人所说,当然可以删除这些信息.

  • +1这似乎是解决您问题的最佳方案.这样就不需要对图像编辑程序的名称进行硬编码,因为这样可以准确地提供存储程序名称的元数据属性值.这使得您无需扫描整个文件中的某些字符串,例如"adobe".人们所说的关于不尊重这种元数据属性的程序的其他事情仍然适用.对于那些做到这一点的人来说,这是最好的解决方案. (3认同)