在 Pillow 和 OpenCV 中打开的图像不相等

che*_*cks 4 python opencv python-imaging-library pillow cv2

我从维基百科(下面看到的树)下载了一个测试图像,以在 python 中进行比较PillowOpenCV(使用cv2)。从感知上看,这两个图像看起来相同,但它们各自的md5哈希值不匹配;如果我减去两个图像,结果甚至不接近纯黑色(原始图像下方显示的图像)。原始图像是 JPEG。如果我先将其转换为 PNG,则哈希值匹配。

最后一张图显示了像素值差异的频率分布。

正如Catree 指出我的减法导致整数溢出。我更新为dtype=int在减法之前也进行转换(以显示负值),然后在绘制差异之前取绝对值。现在差异图像在感知上是纯黑色的。

这是我使用的代码:

from PIL import Image
import cv2
import sys
import md5
import numpy as np

def hashIm(im):
    imP = np.array(Image.open(im))

    # Convert to BGR and drop alpha channel if it exists
    imP = imP[..., 2::-1]
    # Make the array contiguous again
    imP = np.array(imP)
    im = cv2.imread(im)

    diff = im.astype(int)-imP.astype(int)

    cv2.imshow('cv2', im)
    cv2.imshow('PIL', imP)
    cv2.imshow('diff', np.abs(diff).astype(np.uint8))
    cv2.imshow('diff_overflow', diff.astype(np.uint8))

    with open('dist.csv', 'w') as outfile:
        diff = im-imP
        for i in range(-256, 256):
            outfile.write('{},{}\n'.format(i, np.count_nonzero(diff==i)))

    cv2.waitKey(0)
    cv2.destroyAllWindows()

    return md5.md5(im).hexdigest() + '   ' + md5.md5(imP).hexdigest()

if __name__ == '__main__':
    print sys.argv[1] + '\t' + hashIm(sys.argv[1])
Run Code Online (Sandbox Code Playgroud)

一棵树的原始照片(来自维基百科“树”文章)

频率分布更新为显示负值。

更新差异


这是我在实施 Catre 建议的更改之前所看到的。

区别

分布

Cat*_*ree 5

原始图像是 JPEG。

JPEG 解码会根据 libjpeg 版本、编译器优化、平台等产生不同的结果。

检查其中的libjpeg的版本PillowOpenCV使用。

有关更多信息,请参阅此答案: JPEG 图像在多个设备此处具有不同的像素值

顺便说一句,(im-imP)会产生uint8溢出(如果没有在频率图中看到它,就没有办法拥有如此大量的大像素差异)。尝试投射到int在进行频率计算之前类型。