Lod*_*eli 2 queue replication azure-service-fabric
我在 ServiceFabric 集群上遇到此警告消息:
“主复制队列使用率 95% 已达到/超过阈值 80%。第一个复制操作 = 1818843,最后一个复制操作 = 1826640”
当分区处于这种情况时,其他服务对它的每次调用都将停留在等待方法返回。
我尝试寻找此消息的含义但没有成功。这意味着什么以及可能导致它的原因是什么?
小智 5
为了实现高可用性,Service Fabric 有状态服务将其状态复制到配置的目标副本。每次主副本收到写操作时,都会在本地应用该操作并将其发送到辅助副本;它会等到法定数量的副本确认该操作,然后再返回给用户。
一旦该操作被分区中的所有副本确认,该操作就会从队列中删除。
如果辅助队列的 ACK 速度很慢,则主队列会被填满,然后写入操作就会停止。读操作不受影响。在您的情况下,复制队列具有序列号为 1818843 到 1826640 的操作。
队列中出现如此多操作的原因可能是:主节点或辅助节点上的磁盘持久化速度缓慢(由于磁盘速度慢、IO 过多等),或者来自一个或多个辅助节点的消息延迟,不允许主节点删除操作从队列中。
归档时间: |
|
查看次数: |
799 次 |
最近记录: |