lou*_*zer 15 algorithm performance nearest-neighbor pca approximate-nn-searching
我有一个在100维空间中有500,000个点的数据库,我想找到最接近的2个点.我该怎么做?
更新:太空是欧几里得,对不起.并感谢所有的答案.顺便说一句,这不是功课.
在您的数据上运行PCA,将矢量从100维转换为20维.然后创建一个K-Nearest Neighbor树(KD-Tree)并根据欧几里德距离得到最近的2个邻居.
一般如果没有.尺寸非常大,那么你必须要么采用蛮力方法(并行+分布式/地图缩减)或基于聚类的方法.