文本的感知哈希函数

Tar*_*ula 5 python algorithm hash

有谁知道一个简单的文本感知哈希算法?我看了一下pHash函数,ph_texthash但我想要一个更简单的算法.最好是在Python中.谢谢 !

mik*_*iku 4

关于感知哈希函数的博客文章(在成像上下文中):

和一些相关的Python代码(处理图像,而不是文本,但可能是适应性强的):


据我了解,关于文本内容的感知哈希的简短演示有多种方法(在不同的维度,例如文本的级别、语言或统计方法、选择用来表示文本的模型……),以及正确的方法。其中之一取决于您的领域和您尝试解决的问题。

您还可以研究Locality-sensitive hashing

是一种对高维数据进行概率降维的方法。基本思想是对输入项进行哈希处理,以便相似的项以高概率映射到相同的桶(桶的数量远小于可能输入项的范围)