Ale*_*sky 9 amazon-web-services amazon-elb
各种客户端/目标/elb 重置计数指标的文档 ( TCP_Client_Reset_Count
,TCP_Target_Reset_Count
, TCP_ELB_Reset_Count
)只是说它们对 RST 数据包进行计数。我试图了解什么是 RST 数据包,它似乎与断开的 TCP 连接有关。我的负载均衡器有一个长期的、看似成功的客户端连接。为什么我看到每小时 100 次客户端重置?我还看到每小时大约 10 次负载均衡器重置,以及 0 次目标重置。
编辑:我刚刚观察到增加服务器实例的大小(我使用的是 Farscape——将 0.25 个 vCPU 增加到 0.5)导致每小时客户端重置减少 10 倍。负载平衡器重置的次数没有改变。
我的预感是,这与网络负载均衡器中的一个错误有关,该错误导致它发送的运行状况检查数量是应有的 100 倍。请参阅:NLB 目标组运行状况检查失控我的理论是,如果目标实例速度不够快,则错误会导致运行状况检查连接以不干净的方式中断。这些损坏的运行状况检查连接会被报告为“客户端重置”,即使它们应该被报告为“ELB 重置”或根本不报告。
发送 TCP RST 的原因有很多。有些是不正常的,意味着错误,有些是 TCP/IP 堆栈或应用程序执行的正常连接清理。
正常 TCP RST 的一个示例是长期存在的连接,该连接超过了一方或另一方施加的某个时间限制。一旦超过时间限制,连接可以“强制”关闭,这将生成 RST。
不正常 TCP RST 的一个示例是由于内部错误而突然断开连接的应用程序。
如果应用程序编写不当,在关闭连接之前未对 TCP 套接字执行正常关闭,也可能导致 TCP RST。
我猜你所看到的行为不是问题。但是,要真正了解情况,您需要对每个连接进行线路跟踪和协议分析,以确定到底发生了什么。
归档时间: |
|
查看次数: |
17534 次 |
最近记录: |