根据这篇文章:https://azure.microsoft.com/en ...,Service Bus每个队列/主题每秒最多可以处理2000条消息.本文:https://azure.microsoft.com/en ...说'这意味着分区队列或主题的总吞吐量不再受单个消息代理或消息存储库的性能限制.' 如果我们创建一个分区队列/主题,我相信它会在内部创建16个分区.我的问题是:分区队列/主题的吞吐量是否线性上升到16 x 2000 = 32,000(近似值)?或者仍然保持2000 msg /秒的吞吐量.能否请您指出分区队列/主题的任何吞吐量基准?我们目前正在分析需要高吞吐量主题的场景.关于这个问题的指导将非常有帮助.
此问题也已发布在Azure网站上,网址为:https://azure.microsoft.com/en-us/documentation/articles/service-bus-performance-improvements/
azure azureservicebus azure-servicebus-queues azure-servicebus-topics
我有一组统一结构的每日 CSV 文件,我将上传到 S3。有一个下游作业将 CSV 数据加载到 Redshift 数据库表中。CSV 中的列数可能会增加,从那时起,新文件中将包含新列。发生这种情况时,我想检测更改并将列自动添加到目标 Redshift 表中。
我的计划是在源 CSV 文件上运行 Glue Crawler。架构中的任何更改都会在 Glue 数据目录中生成新版本的表。然后,我想使用 Java、.NET 或其他语言以编程方式读取 Glue 数据目录中最新版本表的表结构(列及其数据类型),并将其与 Redshift 表的架构进行比较。如果发现新列,我将生成一个 DDL 语句来更改 Redshift 表以添加列。
有人可以指点我使用 Java、.NET 或其他语言读取 Glue 数据目录表的任何示例吗?有没有更好的想法来自动向 Redshift 表添加新列?