使用计算上廉价的Python散列算法检测转推

Lak*_*sad 2 python twitter hash md5

为了能够检测特定推文的RT,我计划在数据库中存储每个格式化推文的哈希值.

我应该使用什么哈希算法.隐秘当然不是必不可少的.只是将数据存储为最小的方式,然后可以以有效的方式进行比较.

我的第一次尝试就是使用md5哈希.但我认为可以使用更高效的散列算法,因为不需要安全性.

Chr*_*rch 6

你真的需要哈希吗?Twitter消息足够短(并且磁盘空间足够便宜),可能更好地存储整个消息,而不是耗费时钟周期来散列它.