Web应用服务器监控

Bra*_*ord 11 java metrics analytics

我已经看到几个StackOverflow帖子讨论了用于监视Web应用程序性能的工具,但没有一个讨论要关注的指标.

应监控哪些Web服务器指标以及哪些应设置警报?

以下是我目前的一些想法:

  • 请求超时(警报)
  • 请求排队(警报)
  • 到第一个字节的时间(可能需要外部监控)
  • 请求/秒

另外,如何在java Web应用程序服务器上测量它们.

squ*_*ull 4

你已经有了一个好的开始。我会监控:

  • 总响应时间
  • 总字节数
  • 吞吐量(请求数/秒)
  • 服务器CPU开销
  • 错误(按错误代码)

我还要提醒您注意以下事项:

  • 应用程序/页面没有响应
  • 响应时间过长(这取决于您的应用程序,您必须弄清楚正常的 SLA)
  • 吞吐量过高(这将提醒您注意 DOS 攻击,以便您采取行动)
  • 50x 错误(如 500、503 等)
  • 服务器 CPU 负载系数过高(同样,您必须确定典型值,并配置您的工具以在出现异常、DOS 或失控进程的另一个指标时向您发出警报)
  • 日志文件中的错误(如果您的工具支持,请将其配置为在日志文件中弹出错误/异常时发送警报)