使用GDAL和Python的最小距离算法

Mar*_*wig 5 python classification gdal

我正在尝试使用GDAL和Python实现图像分类的最小距离算法.在计算了样本区域的平均像素值并将它们存储到数组列表("sample_array")之后,我将图像读入一个名为"values"的数组中.使用以下代码,我遍历此数组:

values = valBD.ReadAsArray()

# loop through pixel columns
for X in range(0,XSize):

    # loop thorugh pixel lines
    for Y in range (0, YSize):

        # initialize variables
        minDist = 9999
        # get minimum distance
        for iSample in range (0, sample_count):
            # dist = calc_distance(values[jPixel, iPixel], sample_array[iSample])

            # computing minimum distance
            iPixelVal = values[Y, X]
            mean = sample_array[iSample]
            dist = math.sqrt((iPixelVal - mean) * (iPixelVal - mean)) # only for testing

            if dist < minDist:
                minDist = dist
                values[Y, X] = iSample

classBD.WriteArray(values, xoff=0, yoff=0)
Run Code Online (Sandbox Code Playgroud)

对于大图像,此过程需要很长时间.这就是为什么我想问一下是否有人知道更快的方法.我不太了解python中不同变量的访问速度.或者也许有人知道我可以使用的图书馆.提前谢谢,马里奥

小智 5

你绝对应该使用NumPy.我使用了一些相当大的栅格数据集,NumPy通过它们进行了刻录.在我的机器上,使用下面的代码,1000 x 1000阵列没有明显的延迟.这是如何工作的解释遵循代码.

import numpy as np
from scipy.spatial.distance import cdist

# some starter data
dim = (1000,1000)
values = np.random.randint(0, 10, dim)

# cdist will want 'samples' as a 2-d array
samples = np.array([1, 2, 3]).reshape(-1, 1)

# this could be a one-liner
# 'values' must have the same number of columns as 'samples'
mins = cdist(values.reshape(-1, 1), samples)
outvalues = mins.argmin(axis=1).reshape(dim)
Run Code Online (Sandbox Code Playgroud)

cdist()计算从每个元素values到每个元素的"距离" samples.这将生成1,000,000 x 3阵列,其中每行n具有从n原始阵列中的像素到每个样本值的距离[1, 2, 3].argmin(axis=1)为您提供每行最小值的索引,这是您想要的.快速重塑为您提供了图像所需的矩形格式.