use*_*163 1 cluster-analysis hierarchical-clustering spatial
我有一个 3 维空间中包含大约 2000 万个点 (x,y,z) 的大型数据集。我知道这些点组织在密集区域中,但这些区域的大小各不相同。我认为标准的无监督 3D 聚类应该可以解决我的问题。
由于我无法先验估计簇的数量,因此我尝试使用 k 范围较宽的 k 均值,但速度很慢,而且我必须估计每个 k 分区的重要性。基本上,我的问题是:如何将点中最重要的部分提取到簇中?
Ano*_*sse 5
k 均值可能不是处理此类数据的最佳算法。
DBSCAN 应该更接近您对密集区域的直觉。
首先尝试样品,然后弄清楚如何扩大规模。
归档时间:
10 年,3 月 前
查看次数:
1186 次
最近记录: