Azure表存储分区键

Question

Azure表存储分区键

两个有些相关的问题.

1)无论如何获得表实体所依赖的服务器的ID？2)使用GUID会给我最好的分区密钥分发吗？如果没有,会是什么？

我们一直在努力争取桌面存储性能.简而言之,它确实很糟糕,但在早期我们意识到使用随机分区键会将实体分布在许多服务器上,这正是我们想要做的事情,因为我们试图实现每秒8000次读取.显然我们的分区键不够随机,所以出于测试目的,我决定只使用GUID.第一印象是waaaaaay更快.

真的很糟糕,性能<每秒1000次.分区键是Guid.NewGuid(),行键是常量"UserInfo".使用TableOperation和pk以及rk执行get,其他内容如下:TableOperation retrieveOperation = TableOperation.Retrieve(pk,rk); return cloudTable.ExecuteAsync(retrieveOperation).我们总是使用索引读取而不是表扫描.此外,VM大小中等或大,从不小.并行不,异步是的

Answer 1

Lui*_*ado 11

正如其他用户所指出的,Azure表由运行时严格控制,因此您无法控制/检查哪些特定存储节点正在处理您的请求.此外,任何给定的分区都由单个服务器提供服务,也就是说,属于同一分区的实体不能在多个存储节点之间进行分割(参见此处)

在Windows Azure表中,PartitionKey属性用作分区键.具有相同PartitionKey值的所有实体都聚集在一起,并且它们从单个服务器节点提供.这允许用户通过设置PartitionKey值来控制实体位置,并对同一分区中的实体执行实体组事务.

您提到您每秒定位8000个请求？如果是这种情况,您可能会达到需要非常好的表/分区键设计的阈值.请参阅文章" Windows Azure存储抽象及其可伸缩性目标 "

以下摘录适用于您的情况:

这将为2012年6月7日之后创建的单个存储帐户提供以下可伸缩性目标.

容量 - 高达200 TB
事务 - 每秒最多20,000个实体/消息/ blob

正如其他用户所指出的,如果您的PartitionKey编号遵循增量模式,Azure运行时将识别这一点,并将同一存储节点中的某些分区组合在一起.

此外,如果我正确理解您的问题,您当前正在通过GUID分配分区键？如果是这种情况,这意味着表中的每个PartitionKey都是唯一的,因此每个partitionkey将只有不超过1个实体.根据上面的文章,Azure表扩展的方式是通过在独立存储节点内的分区键中对实体进行分组.如果您的分区键是唯一的,因此只包含一个实体,这意味着Azure表一次只能扩展一个实体!现在,我们知道Azure不是那么愚蠢,它在分区密钥检测到模式的方式时对它们进行分组.因此,如果您在Azure中使用此触发器并且Azure正在对您的分区键进行分组,则意味着您的可伸缩性功能仅限于此分组算法的智能性.

根据2012年的可扩展性目标,每个分区密钥应该能够每秒为您提供2,000个事务.从理论上讲,在这种情况下,您应该只需要不超过4个分区键(假设四个之间的工作负载均匀分配).

我建议您设计分区键,以便每个分区每秒不超过2,000个实体,并使用GUID作为分区键删除.这将允许您更好地支持实体事务组等功能,降低表设计的复杂性,并获得您正在寻找的性能.

归档时间：	12 年，3 月前
查看次数：	7444 次
最近记录：	12 年，3 月前