拥有一个收集性能统计数据的系统非常有用。过去,我为此使用过Munin,它在分析瓶颈和其他各种问题方面非常宝贵。我最近了解到collectd,它看起来与 Munin 非常相似。
哪些监控应用程序可用且应该考虑(Munin 和 Collectd 除外),您如何选择使用哪一个?
Munin 是一个数据收集器和可视化(绘图)工具。很容易设置。易于使用,但它使用太多资源并且不能很好地扩展。默认的收集间隔是 5 分钟,改变它并不容易,因为它会使你的机器过载,而且如果你这样做,某些插件就会出现问题。每次发生数据收集时都会执行(分叉)插件,这是昂贵的。它有网络设置。即使您使用一台机器,您也必须设置本地服务器和节点。
Collectd 只是一个数据收集器工具。您可以选择 3rd party solltions 来绘制收集的数据,但它不是开箱即用的。它有许多插件,大部分编写为 C 模块,当您启动守护程序时会启动一次。您可以更改收集间隔,并且可以获得细粒度的统计信息。它可以在本地或通过网络收集数据。
我最喜欢的性能监控分析工具是 SGI 的开源Performance CoPilot (PCP)。对于单个系统来说,这可能有点矫枉过正——对于一组企业系统来说,这太棒了。PCP 提供历史数据、网络配置和警报系统,这是开源(或几乎其他任何地方)无法比拟的。