Ari*_*ouk 13 monitoring glusterfs
Glusterfs 虽然是一个不错的分布式文件系统,但几乎没有提供监控其完整性的方法。服务器可以来来去去,砖块可能会变得陈旧或失败,我害怕知道这些可能为时已晚。
最近我们遇到了一个奇怪的故障,当一切正常时,但是一块砖从体积中掉了出来(纯属巧合)。
是否有一种简单可靠的方法(cron 脚本?)可以让我了解 GlusterFS 3.2卷的健康状况?
这是 GlusterFS 开发人员提出的请求已经有一段时间了,但没有任何现成的解决方案可供您使用。然而,通过一些脚本,这并非不可能。
几乎整个 Gluster 系统都是由单个 gluster 命令管理的,并且通过几个选项,您可以编写自己的运行状况监控脚本。有关砖块和体积的列表信息,请参阅此处 - http://gluster.org/community/documentation/index.php/Gluster_3.2:_Displaying_Volume_Information
要监控性能,请查看此链接 - http://gluster.org/community/documentation/index.php/Gluster_3.2:_Monitoring_your_GlusterFS_Workload
更新:请考虑升级到http://gluster.org/community/documentation/index.php/About_GlusterFS_3.3
使用最新版本总是会更好,因为它们似乎有更多错误修复并且得到了良好的支持。当然,在迁移到较新版本之前运行您自己的测试 - http://vbellur.wordpress.com/2012/05/31/upgrading-to-glusterfs-3-3/ :)
第 10 章中有一个管理指南,其中包含用于监控 GlusterFS 3.3 安装的特定部分 - http://www.gluster.org/wp-content/uploads/2012/05/Gluster_File_System-3.3.0-Administration_Guide-en-US .pdf
请参阅此处的另一个 nagios 脚本 - http://code.google.com/p/glusterfs-status/