关于感知哈希函数的博客文章(在成像上下文中):
和一些相关的Python代码(处理图像,而不是文本,但可能是适应性强的):
据我了解,关于文本内容的感知哈希的简短演示有多种方法(在不同的维度,例如文本的级别、语言或统计方法、选择用来表示文本的模型……),以及正确的方法。其中之一取决于您的领域和您尝试解决的问题。
您还可以研究Locality-sensitive hashing,
是一种对高维数据进行概率降维的方法。基本思想是对输入项进行哈希处理,以便相似的项以高概率映射到相同的桶(桶的数量远小于可能输入项的范围)
| 归档时间: |
|
| 查看次数: |
2332 次 |
| 最近记录: |