在键值存储中管理密钥的好方法是什么?

Jua*_*oto 8 database namespaces key redis key-value-store

尝试为键值存储中的键定义一些策略(我们使用的是Redis).键空间应该是:

  • Shardable(可以引入更多服务器并在它们之间展开键空间)

  • Namespaced(应该有一些机制可以逻辑地"组合"键,例如通过域或相关概念)

  • 高效(尝试在数据库中使用尽可能少的空间来存储密钥,以允许尽可能多的数据)

  • 尽可能少碰撞(避免两个不同对象的键相等)


我考虑过的两个选择是这些:

  1. 使用名称空间的前缀,由一些字符(如human_resources:person:<some_id>)分隔.这样做的好处是它具有很强的可扩展性和易于理解性.缺点是可能会发生冲突,具体取决于分隔符(如果id有字符:?),以及可能的大小效率(太多嵌套命名空间可能会创建非常长的键).

  2. 使用一些数据结构(如Ordered Set或Hash)来存储名称空间.这样做的主要缺点是"可破坏性"的丢失,因为存储命名空间的结构需要在单个数据库中.

问题:在分片设置中管理键空间的好方法是什么?我们应该使用这些替代方案,还是我们还没有考虑过其他更好的模式?

非常感谢!

Sri*_*nan 8

Redis世界中普遍接受的约定是选项1 - 即由冒号等字符分隔的命名空间.也就是说,命名空间几乎总是一层深.例如:person:12321而不是human_resources:person:12321.

这如何与您设定的4条指南一起使用?

Shardable - 这种方法是可以破坏的.每个键可以进入不同的分片或相同的分片,具体取决于您的设置方式.

命名空间命名空间作为避免冲突的方法适用于此方法.但是,名称空间作为组密钥的方法并不奏效.通常,使用密钥作为分组数据的方式是一个坏主意.例如,如果一个人从一个部门移动到另一个部门怎么办?如果更改密钥,则必须更新所有引用 - 这会变得棘手.

最好确保密钥永远不会更改为对象.然后可以通过创建单独的索引在外部处理分组.

例如,假设您希望按部门,按工资范围和按位置对人员进行分组.这是你怎么做的 -

  1. 个人用钥匙分开哈希 persons:12321
  2. set为每个组创建一个- 例如:persons_by:department- 并且仅存储此集合中每个人的数字标识符.例如[12321,43432].这样,您就可以获得Redis整数集的优势

高效上面解释的方法非常有效.为了节省更多内存,您可以在应用程序端进一步压缩密钥.例如,您可以存储p:12321而不是persons:12321.只有在通过分析确定需要节省内存时才应该这样做.一般来说,这是不值得的.

无碰撞这取决于您的应用程序.每个用户或个人都应该拥有永不改变的主键.在Redis密钥中使用它,您将不会发生冲突.

您提到了这种方法的两个问题,我将尝试解决它们

如果id有冒号怎么办?

这当然是可能的,但是您的应用程序的设计应该可以防止它.最好不要在标识符中使用特殊字符 - 因为它们将在多个系统中使用.例如,标识符很可能是URL的一部分,冒号即使对于URL也是保留字符.

如果您确实必须在标识符中包含特殊字符,则必须在代码中编写一个包装特殊字符的小包装器.URL编码完全能够处理这个问题.

尺寸效率

长按键有成本,但不是太多.通常,您应该担心值的数据大小而不是密钥.如果您认为密钥占用了太多内存,请使用redis-rdb-tools等工具对数据库进行配置.

如果确定密钥大小有问题并且想要保存内存,则可以编写一个使用别名重写密钥的小包装器.