如何计算像素周围像素的平均值？

Question

如何计算像素周围像素的平均值？

dik*_*ant 2 numpy image-processing noise-reduction python-3.x

我正在尝试创建一个 5x5 均值滤波器以去除图像中的一些盐和胡椒噪声。我将图像读入一个 numpy 数组。并尝试进行一些更改以计算像素邻居的平均值。我得到的结果很糟糕，我似乎无法弄清楚为什么我的图像结果中有差距。

from PIL import Image
import numpy

image1 = 'noisy.jpg'
save1 = 'filtered.jpg'

def average(path, name):
    temp=Image.open(path)
    image_array = numpy.array(temp)
    new_image = []
    for i in range(0, len(image_array)):
        new_image.append([])
    n = 0
    average_sum = 0
    for i in range(0, len(image_array)):
        for j in range(0, len(image_array[i])):
            for k in range(-2, 3):
                for l in range(-2, 3):
                    if (len(image_array) > (i + k) >= 0) and (len(image_array[i]) > (j + l) >= 0):
                        average_sum += image_array[i+k][j+l]
                        n += 1

            new_image[i].append(int(round(average_sum/n)))
            average_sum = 0
            n = 0

    x = Image.fromarray(numpy.array(new_image), 'L')
    x.save(name)
    print("done")

average(image1, save1)

Run Code Online (Sandbox Code Playgroud)

---------------------输入图片-----------------

---------------------输出图像-----------------

Answer 1

Mit*_*ers 6

我只是想警告其他找到此页面的人。基本上，没有人应该somenumpyarray[y,x]一一直接访问像素值。每次键入类似内容时，Numpy 都必须创建 4 个新 Python 对象（tuple包含 RGB 值的对象，以及int每个 R/G/B 值的三个单独对象）。那是因为在 Python 中，一切都是对象（偶数也是对象），这意味着数据不能“直接从 Numpy 中读取”。必须创建实际的 Python对象，并将 Numpy 数据（例如数字）复制到这些对象中，每次您尝试从 Numpy 将某些内容读入 Python 时。

这是您尝试从数组中读取的每个像素 4 个 Python 对象创建。对于 1080p 图像，如果您只读取每个像素一次，即 8 294 400 个对象。但是上面的代码检查了每个像素周围的 5x5（25 像素）矩阵，因此创建了 207 360 000 个对象！疯狂的！

这种对象创建称为装箱（采用原生 Numpy 数据并将其打包/装箱到 Python 对象数据结构中）。以及拆箱（获取 Python 数据，提取它包含的实际值（例如数字）并将其打包到本机 Numpy 数组中）。从 Python 读取/写入 Numpy 数组中的值总是涉及装箱和拆箱，这就是为什么它非常慢，您应该始终使用本机 Numpy 方法来操作您的数据。Numpy 不是我们可以像对待任何随机访问 Python 列表一样对待的通用“数组”。Numpy 用于使用其自己的内置函数进行向量/矩阵运算！事实上，您甚至不应该这样做，for X in some_ndarray因为迭代会调用相同的慢速装箱过程（每个X 此类循环中的项目是从 Numpy 中提取并装箱的）。

无论如何......你想要实现的是一个5x5的“框模糊”，意思是一个5x5正方形半径内所有附近像素的平均值。

因此，您应该使用本机 C++ 库，该库在纯粹、干净的 RAM 中执行所有操作，完全不涉及 Python。一个这样的库是 OpenCV，它接受一个 ndarray（你的图像像素），并在内部直接从 ndarray 拥有的 RAM 中读取，并直接对每个像素进行本机操作。

这是代码：

import cv2

path = "noisy.jpg"
img = cv2.imread(path)
img = cv2.blur(img, (5,5)) # This is now your box-blurred image.

Run Code Online (Sandbox Code Playgroud)

1920x1080 图像中的基准：

您的原始代码（滥用 Numpy 数组致死并创建了超过 2 亿个新 Python 对象）：87.80000 秒（这还没有计算创建超过 2 亿个对象时发生的所有 RAM 滥用）
改用 OpenCV：0.02992 秒（快 2935 倍）

永远不要直接访问 Numpy 数组元素。它不是为了那个。

祝所有未来的读者好运。

编辑：顺便说一下，要回答最初的问题……要去除椒盐噪声，您应该使用中值滤波器而不是框模糊。

输入：

5x5 框模糊（又名平均/平均模糊）：

img = cv2.blur(img, (5,5))

3x3 中值模糊：

img = cv2.medianBlur(img, 3)

归档时间：	7 年，10 月前
查看次数：	5841 次
最近记录：	6 年，3 月前