相关疑难解决方法(0)

高维数据中最近的邻居?

我曾问一个问题,几天就回来了如何找到一个给定矢量最近的邻居.我的矢量现在是21维,在我继续前进之前,因为我不是来自机器学习领域,也不是数学领域,我开始问自己一些基本问题:

  • 欧几里德距离是否是首先找到最近邻居的一个很好的指标?如果没有,我的选择是什么?
  • 此外,如何确定确定k邻居的正确阈值?是否有一些分析可以用来计算出这个值?
  • 以前,我被建议使用kd-Trees,但维基百科页面清楚地表明,对于高维度,kd-Tree几乎相当于蛮力搜索.在这种情况下,有效找到百万点数据集中最近邻居的最佳方法是什么?

有人可以澄清一些(或所有)上述问题吗?

language-agnostic algorithm search machine-learning nearest-neighbor

155
推荐指数
6
解决办法
6万
查看次数