我正在使用SHA-1来检测程序处理文件中的重复项.它不需要加密强大并且可以是可逆的.我找到了这个快速哈希函数列表https://code.google.com/p/xxhash/
如果我想在SHA-1附近的随机数据上获得更快的功能和冲突,我该选择什么?
也许128位哈希足以用于文件重复数据删除?(vs 160 bit sha-1)
在我的程序中,哈希是在0到512 KB的块上计算的.
hash performance sha murmurhash
hash ×1
murmurhash ×1
performance ×1
sha ×1