如何在不丢失离散值的情况下缩小图像？

Question

如何在不丢失离散值的情况下缩小图像？

bzw*_*urg 5 python python-imaging-library

我有一个具有离散颜色的城市的图像（绿色=草地，黑色=建筑物，白色/黄色=道路）。使用 Pillow，我将图片导入到我的 (Python) 程序中，并将其转换为具有离散颜色值的 Numpy 数组（即绿色像素变为 1，黑色像素变为 2，等等）。

我想降低图像的分辨率（出于计算目的），同时保留尽可能多的信息。然而，使用 Pillow 的 resize() 方法，颜色会偏离这些离散值。如何缩小该图像的尺寸，同时（最重要的是）保留离散颜色并且（也很重要）丢失尽可能少的信息？

这是图像的示例： https: //i.stack.imgur.com/tq9RE.png

编辑：根据请求，一些代码：

from PIL import Image
import Numpy as np

picture = Image.open(some_image.png)

width, height = picture.size

pic_array = np.zeros(width,height)

# Turn the image into discrete values
for i in range(0,width):
    for j in range(0,height):
        red, green, blue = picture.getpixel((i,j))
        if red == a and green == b and blue == c:
            #An example of how discrete colors are converted to values
            pic_array[i][j] = 1

Run Code Online (Sandbox Code Playgroud)

缩放可以通过两种方式完成：

1) 使用 Pillow 的调整大小库缩放原始图像或 2) 使用以下内容重新缩放最终数组：

scaled_array = pic_array[0:width:5, 0:height,5]

Run Code Online (Sandbox Code Playgroud)

选项 1 在保留信息方面“很好”，但丢失了离散值，而选项 2 则相反。

Answer 1

Mar*_*ell 2

我对这个问题很感兴趣，并编写了一些代码来尝试一些想法 - 特别是@jasonharper 在评论中建议的“模式”过滤器。所以，我把它编程了。

首先，输入图像不是 4 个明确定义的类，而是实际上有 6,504 种不同的颜色，因此我使用ImageMagick制作了 4 种颜色的调色板，如下所示：

magick xc:black xc:white xc:yellow xc:green +append palette.png

Run Code Online (Sandbox Code Playgroud)

这里是放大的 - 实际上是 4x1 像素：

然后我将图像中的颜色映射到 4 种离散颜色的调色板：

magick map.png +dither -remap palette.png start.png

Run Code Online (Sandbox Code Playgroud)

然后我尝试使用以下代码来计算每个 3x3 窗口的中位数和众数：

#!/usr/bin/env python3

from PIL import Image
import numpy as np
from scipy import stats
from skimage.util import view_as_blocks

# Open image and make into Numpy array
im = Image.open('start.png')
na = np.array(im)

# Make a view as 3x3 blocks - crop anything not a multiple of 3
block_shape=(3,3)
view = view_as_blocks(na[:747,:], block_shape)
flatView = view.reshape(view.shape[0], view.shape[1], -1)   # now (249,303,9)

# Get median of each 3x3 block
resMedian = np.median(flatView, axis=2).astype(np.uint8)
Image.fromarray(resMedian*60).save('resMedian.png')        # arbitrary scaling by 60 for contrast

# Get mode of each 3x3 block
resMode   = stats.mode(flatView, axis=2)[0].reshape((249,303)).astype(np.uint8)
Image.fromarray(resMode*60).save('resMode.png')            # arbitrary scaling by 60 for contrast

Run Code Online (Sandbox Code Playgroud)

这是中值滤波器的结果：

这是“模式”过滤器的结果，恕我直言，它确实更好：

下面是动画对比：

如果有人想获取代码并对其进行调整以尝试新的想法，请随意！

归档时间：	5 年，6 月前
查看次数：	768 次
最近记录：	5 年，6 月前