golang 中 int64 键有更好的分片功能吗?

ros*_*sed 0 algorithm hash go

我正在使用此存储库中的并发地图,可以在使用创建地图时选择键类型NewWithCustomShardingFunction。我只需要为int64键提供我自己的分片函数,这就是我在这里使用的。

我还使用Go可以使用泛型的最新版本,因此我决定通过实现我自己的分片功能来使用concurrent-mapint64

import (
    cmap "github.com/orcaman/concurrent-map/v2"
)

func shardingFunc(key int64) uint32 {
    return uint32(key) // TODO - create a better sharding function that does not rely on how uint32 type conversion works
}

func main() {
    testMap := cmap.NewWithCustomShardingFunction[int64, *definitions.CustomerProduct](shardingFunc)
    // ... use the map ...
}
Run Code Online (Sandbox Code Playgroud)

我想知道我的分片功能对于int64键来说是否合适,或者我应该有更好的分片功能吗?我不想陷入可能给我带来index out of range错误或任何其他问题的情况。

mer*_*ile 6

分片函数是一个哈希函数。该函数应将密钥均匀分布在 32 位空间上。

如果你的 init64 值的低四字节是均匀分布的,那么uint32(key)将用作分片功能。

uint32(key)错误选择的一个例子是低字节具有恒定值。例如,如果键值类似于 0x00010000、0x00020000...,则uint32(key)计算结果为零。这不是均匀分布。

如果您不知道 int64 密钥是如何分布的,那么最好在分片函数中使用密钥的所有位。这是使用 XOR 的一个:

func shardingFunc(key int64) uint32 {
    return uint32(key) ^ uint32(key >> 32) 
}
Run Code Online (Sandbox Code Playgroud)

  • 如果您没有有关 int64 键值分布的任何信息,请使用我的答案中描述的 xor 函数。 (2认同)