相关疑难解决方法(0)

高维数据中最近的邻居?

我曾问一个问题,几天就回来了如何找到一个给定矢量最近的邻居.我的矢量现在是21维,在我继续前进之前,因为我不是来自机器学习领域,也不是数学领域,我开始问自己一些基本问题:

  • 欧几里德距离是否是首先找到最近邻居的一个很好的指标?如果没有,我的选择是什么?
  • 此外,如何确定确定k邻居的正确阈值?是否有一些分析可以用来计算出这个值?
  • 以前,我被建议使用kd-Trees,但维基百科页面清楚地表明,对于高维度,kd-Tree几乎相当于蛮力搜索.在这种情况下,有效找到百万点数据集中最近邻居的最佳方法是什么?

有人可以澄清一些(或所有)上述问题吗?

language-agnostic algorithm search machine-learning nearest-neighbor

155
推荐指数
6
解决办法
6万
查看次数

数以百万计的3D点:如何找到最接近给定点的10个点?

3-d中的点由(x,y,z)定义.任何两个点(X,Y,Z)和(x,y,z)之间的距离d是d = Sqrt [(Xx)^ 2 +(Yy)^ 2 +(Zz)^ 2].现在文件中有一百万个条目,每个条目都是空间中的某个点,没有特定的顺序.给定任意点(a,b,c)找到最近的10个点.您将如何存储百万点以及如何从该数据结构中检索这10个点.

algorithm graphics graph

67
推荐指数
5
解决办法
3万
查看次数

如何在500维点找到100维空间中最接近的2个点?

我有一个在100维空间中有500,000个点的数据库,我想找到最接近的2个点.我该怎么做?

更新:太空是欧几里得,对不起.并感谢所有的答案.顺便说一句,这不是功课.

algorithm performance nearest-neighbor pca approximate-nn-searching

15
推荐指数
4
解决办法
2691
查看次数