3D 点的聚类

use*_*163 1 cluster-analysis hierarchical-clustering spatial

我有一个 3 维空间中包含大约 2000 万个点 (x,y,z) 的大型数据集。我知道这些点组织在密集区域中,但这些区域的大小各不相同。我认为标准的无监督 3D 聚类应该可以解决我的问题。

由于我无法先验估计簇的数量,因此我尝试使用 k 范围较宽的 k 均值,但速度很慢,而且我必须估计每个 k 分区的重要性。基本上,我的问题是:如何将点中最重要的部分提取到簇中?

Ano*_*sse 5

k 均值可能不是处理此类数据的最佳算法。

DBSCAN 应该更接近您对密集区域的直觉。

首先尝试样品,然后弄清楚如何扩大规模。