对于字符串,您可以使用近似匹配算法.
如果字符串与参考字符串等距,则很可能它们彼此相似.你去了你有一个字符串的局部敏感哈希实现.
您可以为一系列距离创建不同的散列桶.
编辑:您可以尝试其他字符串距离的变化.一个更简单的算法就是返回no.两个字符串之间的共同字符.
那么在MSDN博客上有一篇很好的文章:http://blogs.msdn.com/b/spt/archive/2008/06/11/locality-sensitive-hashing-lsh-and-min-hash.aspx
还有至少一次C++库,你可以检查这里的源代码:http://sourceforge.net/projects/lshkit/
| 归档时间: |
|
| 查看次数: |
6303 次 |
| 最近记录: |