使用python numpy找到3d空间中某个点的k个最近邻居

Ben*_*ird 0 python numpy knn

我有一个n点的三维点云,格式为np.array((n,3)).例如,这可能是这样的:

P = [[x1,y1,z1],[x2,y2,z2],[x3,y3,z3],[x4,y4,z4],[x5,y5,z5],.....[xn,yn,zn]]
Run Code Online (Sandbox Code Playgroud)

我希望能够得到每个点的K最近邻居.

所以例如P1的k个最近邻居可能是P2,P3,P4,P5,P6,P2的KNN可能是P100,P150,P2等.

如何在python中做到这一点?

bka*_*lli 10

@marijn-van-vliet 的解决方案满足大多数场景。然而,它被称为强力方法,如果点云相对较大或者您有计算/时间限制,您可能需要考虑构建 KD 树来快速检索点的 K 最近邻。

在Python中,sklearn库在这里提供了一个易于使用的实现:sklearn.neighbors.KDTree

from sklearn.neighbors import KDTree
tree = KDTree(pcloud)

# For finding K neighbors of P1 with shape (1, 3)
indices, distances = tree.query(P1, K)
Run Code Online (Sandbox Code Playgroud)

(另请参阅另一篇文章中的以下答案以获取更详细的用法和输出:/sf/answers/3368898221/

许多其他库确实具有基于 KD-Tree 的 KNN 检索的实现,包括Open3D(基于 FLANN)scipy


Mar*_*iet 8

这可以通过scipy.spatial.distance.pdist巧妙地解决.

首先,让我们创建一个存储3D空间中的点的示例数组:

import numpy as np
N = 10  # The number of points
points = np.random.rand(N, 3)
print(points)
Run Code Online (Sandbox Code Playgroud)

输出:

array([[ 0.23087546,  0.56051787,  0.52412935],
       [ 0.42379506,  0.19105237,  0.51566572],
       [ 0.21961949,  0.14250733,  0.61098618],
       [ 0.18798019,  0.39126363,  0.44501143],
       [ 0.24576538,  0.08229354,  0.73466956],
       [ 0.26736447,  0.78367342,  0.91844028],
       [ 0.76650234,  0.40901879,  0.61249828],
       [ 0.68905082,  0.45289896,  0.69096152],
       [ 0.8358694 ,  0.61297944,  0.51879837],
       [ 0.80963247,  0.1680279 ,  0.87744732]])
Run Code Online (Sandbox Code Playgroud)

我们计算每个点,到所有其他点的距离:

from scipy.spatial import distance
D = distance.squareform(distance.pdist(points))
print(np.round(D, 1))  # Rounding to fit the array on screen
Run Code Online (Sandbox Code Playgroud)

输出:

array([[ 0. ,  0.4,  0.4,  0.2,  0.5,  0.5,  0.6,  0.5,  0.6,  0.8],
       [ 0.4,  0. ,  0.2,  0.3,  0.3,  0.7,  0.4,  0.4,  0.6,  0.5],
       [ 0.4,  0.2,  0. ,  0.3,  0.1,  0.7,  0.6,  0.6,  0.8,  0.6],
       [ 0.2,  0.3,  0.3,  0. ,  0.4,  0.6,  0.6,  0.6,  0.7,  0.8],
       [ 0.5,  0.3,  0.1,  0.4,  0. ,  0.7,  0.6,  0.6,  0.8,  0.6],
       [ 0.5,  0.7,  0.7,  0.6,  0.7,  0. ,  0.7,  0.6,  0.7,  0.8],
       [ 0.6,  0.4,  0.6,  0.6,  0.6,  0.7,  0. ,  0.1,  0.2,  0.4],
       [ 0.5,  0.4,  0.6,  0.6,  0.6,  0.6,  0.1,  0. ,  0.3,  0.4],
       [ 0.6,  0.6,  0.8,  0.7,  0.8,  0.7,  0.2,  0.3,  0. ,  0.6],
       [ 0.8,  0.5,  0.6,  0.8,  0.6,  0.8,  0.4,  0.4,  0.6,  0. ]])
Run Code Online (Sandbox Code Playgroud)

你像这样读取这个距离矩阵:点1和5之间的距离是distance[0, 4].例如,您还可以看到每个点与其自身之间的距离为0distance[6, 6] == 0

我们argsort距离矩阵的每一行为每个点得到哪个点最接近的列表:

closest = np.argsort(D, axis=1)
print(closest)
Run Code Online (Sandbox Code Playgroud)

输出:

[[0 3 1 2 5 7 4 6 8 9]
 [1 2 4 3 7 0 6 9 8 5]
 [2 4 1 3 0 7 6 9 5 8]
 [3 0 2 1 4 7 6 5 8 9]
 [4 2 1 3 0 7 9 6 5 8]
 [5 0 7 3 6 2 8 4 1 9]
 [6 7 8 9 1 0 3 2 4 5]
 [7 6 8 9 1 0 3 2 4 5]
 [8 6 7 9 1 0 3 5 2 4]
 [9 6 7 1 8 4 2 0 3 5]]
Run Code Online (Sandbox Code Playgroud)

再次,我们看到每个点都与自身最接近.所以,无视这一点,我们现在可以选择最近的k点:

k = 3  # For each point, find the 3 closest points
print(closest[:, 1:k+1])
Run Code Online (Sandbox Code Playgroud)

输出:

[[3 1 2]
 [2 4 3]
 [4 1 3]
 [0 2 1]
 [2 1 3]
 [0 7 3]
 [7 8 9]
 [6 8 9]
 [6 7 9]
 [6 7 1]]
Run Code Online (Sandbox Code Playgroud)

例如,我们看到对于点4,k = 3个最近点是1,3和2.