我们的应用程序之一偶尔会出现错误:
Cassandra timeout during read query at consistency LOCAL_QUORUM (2 responses were required but only 1 replica responded)
Run Code Online (Sandbox Code Playgroud)
在一个小时内,我们可能会收到 20 或 30 个超过 10,000 个或更多的查询。并且重试查询通常有效。
它似乎确实是某种超时。该错误出现在应用程序日志中,但在 cassandra system.log 和 debug.log 中我没有看到任何相应的错误或警告,或任何真正的东西。
我在网上进行的所有搜索都会导致人们一致看到这一点的查询,但对我来说却不一致。集群本身健康,其他查询返回就好。被查询的表并不大(每台服务器上几十 MB)。查看 tablehistorgrams,我没有看到任何服务器上有问题的表的读取或写入过大。CPU,内存等都很好。
该表的典型直方图当前为
Percentile SSTables Write Latency Read Latency Partition Size Cell Count
(micros) (micros) (bytes)
50% 2.00 29.52 152.32 1916 72
75% 3.00 35.43 379.02 24601 770
95% 3.00 51.01 379.02 454826 14237
98% 3.00 61.21 379.02 654949 20501
99% 3.00 73.46 379.02 785939 24601
Min 0.00 …Run Code Online (Sandbox Code Playgroud)