除了通常的系统统计信息(i/o、ram 使用情况、cpu、负载等),我目前正在收集问题、qps、运行查询和缓冲池命中。
我觉得qps很没用,因为我们的生产服务器正常运行时间非常长,而且是平均值。
我想知道mysql 生产服务器的统计信息收集的最佳实践。我还应该收集/监控哪些其他统计数据以了解服务器上的负载并迅速采取行动而不对其施加更多压力?
编辑 :
我不是在寻找第 3 方解决方案,我已经在使用 zabbix(以及创建手写脚本的能力)来收集统计信息/监控我们的 mysql 集群。在此链接中有可能收集的统计数据列表。当然还有一些统计信息没有在这里列出,可以通过 shell 脚本收集。真正的问题是必须收集哪些统计信息才能有效地监控我们的集群,而不会产生充满统计信息的不必要的垃圾。
示例:我们Qcache_hit / Qcache_hit + queries是否应该获取ratio 以查看我们的表是否足够热?
mysql ×1