Java中的LSH库

s1l*_*nce 22 java locality-sensitive-hash

我正在寻找一个轻量级的Java库,它支持Locality Sensitive Hashing的最近邻搜索,用于在具有数十万个数据点的高维(在我的情况下为32)数据集中几乎均匀分布的数据.

将查询中的所有条目都放入存储桶中就足够了.考虑到我的问题包括的一些过滤器参数,我可以以不同的方式处理我真正需要的那些.

我已经发现了可能性,但希望有一些更小的东西,而不需要任何其他工具(如可爱的情况下的Apache Hadoop).

nil*_*lsi 6

也许这一个:

"TarsosLSH是一个实现局部敏感哈希(LSH)的Java库,这是一种在次线性时间内运行的多维向量的实用最近邻搜索算法.它支持多个局部敏感哈希(LSH)族:欧几里德哈希族(L2),城市块散列系列(L1)和余弦散列系列.该库试图在能够完成任务的能力之间找到最佳位置,并且足够紧凑以充当LSH如何工作的演示.

代码可以在这里找到


小智 1

有这个: http: //code.google.com/p/lsh-clustering/

我还没有时间测试它,但至少它可以编译。