关于多探针局部敏感哈希的问题

Yij*_*sei 6 c++ algorithm hash machine-learning image-processing

很抱歉要问这种noob问题,但因为我真的需要一些关于如何使用Multi probe LSH的指导非常紧急,所以我自己没有做太多的研究.我意识到有一个可以实现该算法的lib调用LSHKIT,但我无法弄清楚如何使用它.现在,我有几千个特征向量296维度,每个维度代表一个图像.该向量用于查询用户输入图像,以检索最相似的图像.我用来推导矢量之间距离的方法是欧几里德距离.

我知道这可能是一个相当noob的问题,但你们是否知道如何实现多探针LSH?我非常感谢任何答复或回应.

- 更新 -

尝试使用提供的工具fitdata为我的数据创建一个模型,但它似乎没有收录我的文件.我用于输入的格式是这种格式,float size:4,数据的数量:20,dimension:297,以及我的297 dimenison float数组的数组.但是它给了我这个错误

gsl: init_source.c:29: ERROR: matrix dimension n1 must be positive integer
Default GSL error handler invoked.
Aborted
Run Code Online (Sandbox Code Playgroud)

你们有没有想过如何为fitdata创建输入?

- 更新 -

对不起,在尝试lsh后更新.您可以使用text2bin格式化fitdata的数据.文本文件包含图像或音频文件的特征向量,每行代表一个向量.之后,使用mplsh-tune获取M和W参数.要构造索引,可以使用扫描工具对一组所需的查询进行采样,并且可以使用mplsh-run来获取索引.现在我试图弄清楚如何使用索引以及如何将库链接到我的编码.有没有人对此有任何想法?

bay*_*yer 6

让我来指一下光谱散列,这会激发LSH的重要时刻.奖励:他们在自己的网站上有matlab代码,您可以使用或验证自己的实施.此外,它更容易实现.