相关疑难解决方法(0)

如何使用Python使用最近邻算法对数据进行分类?

我需要用(希望)最近邻算法对一些数据进行分类.我已经google了这个问题,发现了很多库(包括PyML,mlPy和Orange),但我不确定从哪里开始.

我该如何使用Python实现k-NN?

python machine-learning

42
推荐指数
1
解决办法
2万
查看次数

我可以使用任意指标来搜索KD树吗?

我刚刚完成了一个用于快速最近邻搜索的kd树.我有兴趣玩欧几里德距离以外的不同距离指标.我对kd-tree的理解是,如果度量是非欧几里德,那么快速的kd-tree搜索不能保证给出精确的搜索,这意味着如果我想尝试我可能需要实现一个新的数据结构和搜索算法我的搜索新指标.

我有两个问题:

  1. 使用kd树永久地将我绑定到欧几里德距离吗?
  2. 如果是这样,我应该尝试使用哪种其他类型的算法来处理任意指标?我没有太多时间来实现许多不同的数据结构,但我正在考虑的其他结构包括覆盖树vp树.

algorithm math search machine-learning data-structures

9
推荐指数
1
解决办法
3143
查看次数

什么是在Postgres中存储矢量数据的有效方法?

我有一些矢量,来自嵌入面,我想将它们存储在数据库中.我需要的是能够在给定嵌入式面的情况下从数据库中找到类似的向量.

我曾尝试在Postgres中使用数组类型,但不支持减法.

  1. 短期问题是:我们能否在Postgres的数据库级别有效地执行数组减法?
  2. 长期问题是:这种类型的数据和计算是否有更好的数据库系统?

谢谢

--Update--

具体问题是,假设我在表格中有一些矢量数据

{1, 2, 3},
{4, 5, 6},
{7, 8, 9}
Run Code Online (Sandbox Code Playgroud)

我想弄清楚这三个向量中的哪一个与向量最接近(在欧几里德距离内){5, 5, 5}.

所需的操作首先减去2个向量,然后找出差异的长度 ||{5, 5, 5} - {4, 5, 6}||_2

在我的场景中,矢量将具有128个维度.

database postgresql postgis vector machine-learning

1
推荐指数
1
解决办法
958
查看次数