AWS 网络负载均衡器 - 什么是客户端重置计数（以及为什么它很高）

Question

AWS 网络负载均衡器 - 什么是客户端重置计数（以及为什么它很高）

Ale*_*sky 9 amazon-web-services amazon-elb

各种客户端/目标/elb 重置计数指标的文档 ( TCP_Client_Reset_Count,TCP_Target_Reset_Count , TCP_ELB_Reset_Count)只是说它们对 RST 数据包进行计数。我试图了解什么是 RST 数据包，它似乎与断开的 TCP 连接有关。我的负载均衡器有一个长期的、看似成功的客户端连接。为什么我看到每小时 100 次客户端重置？我还看到每小时大约 10 次负载均衡器重置，以及 0 次目标重置。

编辑：我刚刚观察到增加服务器实例的大小（我使用的是 Farscape——将 0.25 个 vCPU 增加到 0.5）导致每小时客户端重置减少 10 倍。负载平衡器重置的次数没有改变。

Answer 1

Ale*_*sky 5

我的预感是，这与网络负载均衡器中的一个错误有关，该错误导致它发送的运行状况检查数量是应有的 100 倍。请参阅：NLB 目标组运行状况检查失控我的理论是，如果目标实例速度不够快，则错误会导致运行状况检查连接以不干净的方式中断。这些损坏的运行状况检查连接会被报告为“客户端重置”，即使它们应该被报告为“ELB 重置”或根本不报告。

Answer 2

Joh*_*ley 4

发送 TCP RST 的原因有很多。有些是不正常的，意味着错误，有些是 TCP/IP 堆栈或应用程序执行的正常连接清理。

正常 TCP RST 的一个示例是长期存在的连接，该连接超过了一方或另一方施加的某个时间限制。一旦超过时间限制，连接可以“强制”关闭，这将生成 RST。

不正常 TCP RST 的一个示例是由于内部错误而突然断开连接的应用程序。

如果应用程序编写不当，在关闭连接之前未对 TCP 套接字执行正常关闭，也可能导致 TCP RST。

我猜你所看到的行为不是问题。但是，要真正了解情况，您需要对每个连接进行线路跟踪和协议分析，以确定到底发生了什么。

归档时间：	7 年，8 月前
查看次数：	17534 次
最近记录：	6 年，2 月前