我目前面临的问题是寻找一种在python中将约500,000个纬度/经度对聚类的方法。到目前为止,我已经尝试用numpy计算距离矩阵(以传递到scikit-learn DBSCAN中),但是由于输入量如此之大,它很快会吐出内存错误。
这些点存储在元组中,其中包含该点的纬度,经度和数据值。
简而言之,在python中对大量纬度/经度对进行空间聚类的最有效方法是什么?对于此应用程序,我愿意以速度为名牺牲一些准确性。
编辑:要查找的算法的簇数事先未知。
python cluster-analysis geospatial
cluster-analysis ×1
geospatial ×1
python ×1