查看有关局部敏感哈希的维基百科页面。还有一个由麻省理工学院的研究主办的很好的页面。
一般来说,有几种可用的风格:字符串哈希(例如simhash)、集合或 0/1 特征(例如min-wise hashes)以及实向量。
到目前为止,数值哈希的主要技巧基本上是降维。对于字符串,我们的想法是提出一种在进行细微编辑时仍能保持稳健的表示形式。
我也在这个领域做了一些研究,尽管我猜想 stackoverflow 可能不是适合新生工作的地方。
| 归档时间: |
|
| 查看次数: |
6801 次 |
| 最近记录: |