我需要用(希望)最近邻算法对一些数据进行分类.我已经google了这个问题,发现了很多库(包括PyML,mlPy和Orange),但我不确定从哪里开始.
我该如何使用Python实现k-NN?
我有一些矢量,来自嵌入面,我想将它们存储在数据库中.我需要的是能够在给定嵌入式面的情况下从数据库中找到类似的向量.
我曾尝试在Postgres中使用数组类型,但不支持减法.
谢谢
--Update--
具体问题是,假设我在表格中有一些矢量数据
{1, 2, 3},
{4, 5, 6},
{7, 8, 9}
Run Code Online (Sandbox Code Playgroud)
我想弄清楚这三个向量中的哪一个与向量最接近(在欧几里德距离内){5, 5, 5}
.
所需的操作首先减去2个向量,然后找出差异的长度 ||{5, 5, 5} - {4, 5, 6}||_2
在我的场景中,矢量将具有128个维度.