如何计算像素周围像素的平均值?

dik*_*ant 2 numpy image-processing noise-reduction python-3.x

我正在尝试创建一个 5x5 均值滤波器以去除图像中的一些盐和胡椒噪声。我将图像读入一个 numpy 数组。并尝试进行一些更改以计算像素邻居的平均值。我得到的结果很糟糕,我似乎无法弄清楚为什么我的图像结果中有差距。

from PIL import Image
import numpy

image1 = 'noisy.jpg'
save1 = 'filtered.jpg'

def average(path, name):
    temp=Image.open(path)
    image_array = numpy.array(temp)
    new_image = []
    for i in range(0, len(image_array)):
        new_image.append([])
    n = 0
    average_sum = 0
    for i in range(0, len(image_array)):
        for j in range(0, len(image_array[i])):
            for k in range(-2, 3):
                for l in range(-2, 3):
                    if (len(image_array) > (i + k) >= 0) and (len(image_array[i]) > (j + l) >= 0):
                        average_sum += image_array[i+k][j+l]
                        n += 1

            new_image[i].append(int(round(average_sum/n)))
            average_sum = 0
            n = 0

    x = Image.fromarray(numpy.array(new_image), 'L')
    x.save(name)
    print("done")

average(image1, save1)
Run Code Online (Sandbox Code Playgroud)

---------------------输入图片-----------------

输入图像

---------------------输出图像-----------------

在此处输入图片说明

Mit*_*ers 6

我只是想警告其他找到此页面的人。基本上,没有人应该somenumpyarray[y,x]一一直接访问像素值。每次键入类似内容时,Numpy 都必须创建 4 个新 Python 对象(tuple包含 RGB 值的对象,以及int每个 R/G/B 值的三个单独对象)。那是因为在 Python 中,一切都是对象(偶数也是对象),这意味着数据不能“直接从 Numpy 中读取”。必须创建实际的 Python对象,并将 Numpy 数据(例如数字)复制到这些对象中,每次您尝试从 Numpy 将某些内容读入 Python 时。

这是您尝试从数组中读取的每个像素 4 个 Python 对象创建。对于 1080p 图像,如果您只读取每个像素一次,即 8 294 400 个对象。但是上面的代码检查了每个像素周围的 5x5(25 像素)矩阵,因此创建了 207 360 000 个对象!疯狂的!

这种对象创建称为装箱(采用原生 Numpy 数据并将其打包/装箱到 Python 对象数据结构中)。以及拆箱(获取 Python 数据,提取它包含的实际值(例如数字)并将其打包到本机 Numpy 数组中)。从 Python 读取/写入 Numpy 数组中的值总是涉及装箱和拆箱,这就是为什么它非常慢,您应该始终使用本机 Numpy 方法来操作您的数据。Numpy 不是我们可以像对待任何随机访问 Python 列表一样对待的通用“数组”。Numpy 用于使用其自己的内置函数进行向量/矩阵运算!事实上,您甚至不应该这样做,for X in some_ndarray因为迭代会调用相同的慢速装箱过程(每个X 此类循环中的项目是从 Numpy 中提取并装箱的)。

无论如何......你想要实现的是一个5x5的“框模糊”,意思是一个5x5正方形半径内所有附近像素的平均值。

因此,您应该使用本机 C++ 库,该库在纯粹、干净的 RAM 中执行所有操作,完全不涉及 Python。一个这样的库是 OpenCV,它接受一个 ndarray(你的图像像素),并在内部直接从 ndarray 拥有的 RAM 中读取,并直接对每个像素进行本机操作。

这是代码:

import cv2

path = "noisy.jpg"
img = cv2.imread(path)
img = cv2.blur(img, (5,5)) # This is now your box-blurred image.
Run Code Online (Sandbox Code Playgroud)

1920x1080 图像中的基准:

  • 您的原始代码(滥用 Numpy 数组致死并创建了超过 2 亿个新 Python 对象):87.80000 秒(这还没有计算创建超过 2 亿个对象时发生的所有 RAM 滥用)
  • 改用 OpenCV:0.02992 秒(快 2935 倍)

永远不要直接访问 Numpy 数组元素。它不是为了那个。

祝所有未来的读者好运。


编辑:顺便说一下,要回答最初的问题……要去除椒盐噪声,您应该使用中值滤波器而不是框模糊。

输入:

输入

5x5 框模糊(又名平均/平均模糊):

img = cv2.blur(img, (5,5))

模糊

3x3 中值模糊:

img = cv2.medianBlur(img, 3)

中位数