如何在不丢失离散值的情况下缩小图像?

bzw*_*urg 5 python python-imaging-library

我有一个具有离散颜色的城市的图像(绿色=草地,黑色=建筑物,白色/黄色=道路)。使用 Pillow,我将图片导入到我的 (Python) 程序中,并将其转换为具有离散颜色值的 Numpy 数组(即绿色像素变为 1,黑色像素变为 2,等等)。

我想降低图像的分辨率(出于计算目的),同时保留尽可能多的信息。然而,使用 Pillow 的 resize() 方法,颜色会偏离这些离散值。如何缩小该图像的尺寸,同时(最重要的是)保留离散颜色并且(也很重要)丢失尽可能少的信息?

这是图像的示例: https: //i.stack.imgur.com/tq9RE.png

编辑:根据请求,一些代码:

from PIL import Image
import Numpy as np

picture = Image.open(some_image.png)

width, height = picture.size

pic_array = np.zeros(width,height)

# Turn the image into discrete values
for i in range(0,width):
    for j in range(0,height):
        red, green, blue = picture.getpixel((i,j))
        if red == a and green == b and blue == c:
            #An example of how discrete colors are converted to values
            pic_array[i][j] = 1

Run Code Online (Sandbox Code Playgroud)

缩放可以通过两种方式完成:

1) 使用 Pillow 的调整大小库缩放原始图像或 2) 使用以下内容重新缩放最终数组:

scaled_array = pic_array[0:width:5, 0:height,5]
Run Code Online (Sandbox Code Playgroud)

选项 1 在保留信息方面“很好”,但丢失了离散值,而选项 2 则相反。

Mar*_*ell 2

我对这个问题很感兴趣,并编写了一些代码来尝试一些想法 - 特别是@jasonharper 在评论中建议的“模式”过滤器。所以,我把它编程了。

首先,输入图像不是 4 个明确定义的类,而是实际上有 6,504 种不同的颜色,因此我使用ImageMagick制作了 4 种颜色的调色板,如下所示:

magick xc:black xc:white xc:yellow xc:green +append palette.png
Run Code Online (Sandbox Code Playgroud)

这里是放大的 - 实际上是 4x1 像素:

在此输入图像描述

然后我将图像中的颜色映射到 4 种离散颜色的调色板:

magick map.png +dither -remap palette.png start.png
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述

然后我尝试使用以下代码来计算每个 3x3 窗口的中位数和众数:

#!/usr/bin/env python3

from PIL import Image
import numpy as np
from scipy import stats
from skimage.util import view_as_blocks

# Open image and make into Numpy array
im = Image.open('start.png')
na = np.array(im)

# Make a view as 3x3 blocks - crop anything not a multiple of 3
block_shape=(3,3)
view = view_as_blocks(na[:747,:], block_shape)
flatView = view.reshape(view.shape[0], view.shape[1], -1)   # now (249,303,9)

# Get median of each 3x3 block
resMedian = np.median(flatView, axis=2).astype(np.uint8)
Image.fromarray(resMedian*60).save('resMedian.png')        # arbitrary scaling by 60 for contrast

# Get mode of each 3x3 block
resMode   = stats.mode(flatView, axis=2)[0].reshape((249,303)).astype(np.uint8)
Image.fromarray(resMode*60).save('resMode.png')            # arbitrary scaling by 60 for contrast
Run Code Online (Sandbox Code Playgroud)

这是中值滤波器的结果:

在此输入图像描述

这是“模式”过滤器的结果,恕我直言,它确实更好:

在此输入图像描述

下面是动画对比:

在此输入图像描述

如果有人想获取代码并对其进行调整以尝试新的想法,请随意!