标签: murmurhash

function generateHashes(obj) {
  long hash = murmur3_hash(obj);
  long hash1 = murmur3_hash(hash+1);
  long hash2 = murmur3_hash(hash+2);
  long hash3 = murmur3_hash(hash+3);
  (hash1, hash2, hash3)
}

Run Code Online (Sandbox Code Playgroud)

如果没有,那么这将是一个简单有用的方法？我希望有一个解决方案,如果需要,我可以轻松扩展更多哈希函数.

谢谢

algorithm hash bloom-filter murmurhash

dev*_*ium

2018 02-11

10
推荐指数

1
解决办法

743
查看次数

Murmurhash 2的结果是Python和Haskell

Haskell和Python似乎不同意Murmurhash2的结果.Python,Java和PHP返回相同的结果,但Haskell没有.关于Haskell上的Murmurhash2我做错了吗？

这是我的Haskell Murmurhash2的代码:

import Data.Digest.Murmur32

    main = do
    print $ asWord32 $ hash32WithSeed 1 "woohoo"

Run Code Online (Sandbox Code Playgroud)

这是用Python编写的代码:

import murmur

if __name__ == "__main__":
    print murmur.string_hash("woohoo", 1)

Run Code Online (Sandbox Code Playgroud)

Python返回3650852671,而Haskell返回3966683799

python hash haskell mismatch murmurhash

Axe*_*nto

lucky-day

8
推荐指数

2
解决办法

1144
查看次数

从MurmurHash迁移到MurmurHash3

在Scala 2.10中,MurmurHash由于某种原因被弃用,说我MurmurHash3现在应该使用.但是API是不同的,并且没有有用的scaladoc用于MurmurHash3- >失败.

例如,当前代码:

trait Foo {
  type Bar
  def id: Int
  def path: Bar

  override def hashCode = {
    import util.MurmurHash._
    var h = startHash(2)
    val c = startMagicA
    val k = startMagicB
    h = extendHash(h, id, c, k)
    h = extendHash(h, path.##, nextMagicA(c), nextMagicB(k))
    finalizeHash(h)
  }
}

Run Code Online (Sandbox Code Playgroud)

我该如何使用MurmurHash3呢？这需要一个快速的操作,最好不分配,所以我不希望建立一个Product,Seq,Array[Byte]或whathever MurmurHash3似乎为我提供.

hash scala murmurhash

0__*_*0__

lucky-day

7
推荐指数

1
解决办法

2709
查看次数

使用 Apache MurmurHash3.java x86 32 位方法获得负值

我必须使用 x86 32 位 murmurhash 来确定我在 Kafka 中发送消息的分区。另一个应用程序正在使用 NodeJS murmurhash.v3() 方法从预期分区获取消息。

我尝试了两种方法：

首先，我从https://svn.apache.org/repos/asf/mahout/trunk/math/src/main/java/org/apache/mahout/math/MurmurHash3.java获取了 Java 类
我还尝试将NodeJS murmurhash.v3()的JS代码翻译成Java（下表中的N到A列）

这是我用来从 Apache java 方法获取值的代码：

int ret = MurmurHash3.MurmurHashV3(key, new Long(KAFKA_PARTITION_SEED).intValue());

Run Code Online (Sandbox Code Playgroud)

注意：目前，KAFKA_PARTITION_SEED = 100，但这只是一个测试值。未来将是一个 Long 值。

这是我完成的从 NodeJS转换为 Java 的代码：

    static int MurmurHashV3(String key, int seed) {
    int remainder;
    int bytes;
    int h1;
    int h1b;
    int c1;
    int c2;
    int k1;
    int i;

    remainder = key.length() & 3; // key.length % 4
    bytes = key.length() - remainder;
    h1 = …

Run Code Online (Sandbox Code Playgroud)

apache node.js murmurhash

Céd*_*UIN

lucky-day

5
推荐指数

1
解决办法

1376
查看次数

如何创建自定义 Murmur Avalanche 混合器？

我正在尝试使用 Avalanche 混合器来散列整数坐标。我一直在使用Murmur3 的32 位和 64 位雪崩混合器来执行此操作（而不是实际的总哈希函数）。对于我的应用程序，不需要整个哈希函数，只需要此处看到的 Avalanche Mixer：

uint32_t murmurmix32( uint32_t h )
{
  h ^= h >> 16;
  h *= 0x85ebca6b;
  h ^= h >> 13;
  h *= 0xc2b2ae35;
  h ^= h >> 16;

  return h;
}


uint64_t murmurmix64( uint64_t h )
{
  h ^= h >> 33;
  h *= 0xff51afd7ed558ccdULL;
  h ^= h >> 33;
  h *= 0xc4ceb9fe1a85ec53ULL;
  h ^= h >> 33;

  return h;
}

Run Code Online (Sandbox Code Playgroud)

这些在我的机器上出现得很快，我将两个 uint32_t 混合到这些函数中以产生雪崩的结果，这会产生我喜欢的伪随机分布。

我想向这个系统引入更多坐标（即 z 和 w），所以我想使用更大的雪崩混合器来散列我的坐标。我相信出于我的目的，我希望看到函数本身产生的最大值是 uint64_t，碰撞本身不是问题，但结果的随机性是问题。

murmur3 …

c++ random hash murmurhash

whn*_*whn

2017 07-20

5
推荐指数

1
解决办法

881
查看次数