Munin 聚合图不起作用

use*_*148 5 ubuntu monitoring munin graph

我知道之前在许多论坛上已经多次询问过这个问题,但我仍然遇到类似的问题。

单个图工作正常,但聚合图则不然。我什至没有得到一个空图(没有数据的图)。

所有机器都在 Ubuntu-12.04 m1.medium ec2 实例上运行。Munin 版本是 1.4.6。

我的 munin.conf 看起来像...

[localhost.localdomain]
地址 127.0.0.1
use_node_name 是

[.us-west-1.compute.internal]
地址
use_node_name 是

[.us-west-1.compute.internal]
地址
use_node_name 是

[.us-west-1.compute.internal]
地址
use_node_name 是

[us-west-1.compute.internal;totalcheckpoints]
更新没有
联系没有

postgres_checkpoints_checkpoints_req.update no  
postgres_checkpoints_checkpoints_req.graph yes  
postgres_checkpoints_checkpoints_req.graph_args --base 1000 -l 0  
postgres_checkpoints_checkpoints_req.cdef 0  
postgres_checkpoints_checkpoints_req.graph_category PG Total Checkpoints  
postgres_checkpoints_checkpoints_req.graph_title Aggregated checkpoints  
postgres_checkpoints_checkpoints_req.graph_vlabel Total Checkpoints  
postgres_checkpoints_checkpoints_req.checkpoints_req_total.label Total checkpoints  
postgres_checkpoints_checkpoints_req.graph_order checkpoints_req_total  
postgres_checkpoints_checkpoints_req.checkpoints_req_total.sum \  
        <internal_ip>.us-west-1.compute.internal:postgres_checkpoints_<internal_ip>.us-west-1.compute.internal_checkpoints_req.checkpoints_req \  
        <internal_ip>.us-west-1.compute.internal:postgres_checkpoints_<internal_ip>.us-west-1.compute.internal_checkpoints_req.checkpoints_req \  
        <internal_ip>.us-west-1.compute.internal:postgres_checkpoints_<internal_ip>.us-west-1.compute.internal_checkpoints_req.checkpoints_req  
Run Code Online (Sandbox Code Playgroud)

我尝试在 /etc/munin/plugins 中遵循以下符号链接:

postgres_checkpoints -> /usr/share/munin/plugins/postgres_checkpoints
postgres_checkpoints_ -> /usr/share/munin/plugins/postgres_checkpoints
postgres_checkpoints__ -> /usr/share/munin/plugins/postgres_checkpoints

由于 munin 用户遵循 munin 命令工作正常,我在输出中没有看到任何明显错误:

sudo su - munin -s /bin/bash
/usr/share/munin/munin-update --debug --nofork
/usr/share/munin/munin-graph --debug --nofork --nolazy
/usr/share/ munin/munin-html --debug

telnet 返回插件 postgres_checkpoints 的正确信息:

munin@hostname:~$ telnet 4949
正在尝试...
连接到 .
转义字符是“^]”。
# munin 节点位于 internal-ip-of-munin-node.us-west-1.compute.internal
config postgres_checkpoints
graph_title PostgreSQL 检查点
graph_vlabel 检查点 / 分钟
graph_category PostgreSQL
graph_info 每分钟检查点数
graph_args --base 1000
graph_period 分钟 checkpoints_timed.label定时检查
点checkpoints_timed.info检查点由超时开始
checkpoints_timed.type DERIVE
checkpoints_timed.draw LINE1
checkpoints_req.label 请求的
检查点
checkpoints_req.info 检查点由请求
checkpoints_req.type DERIVE
checkpoints_req.draw STACK 开始

获取 postgres_checkpoints
checkpoints_timed.value 2860
checkpoints_req.value 37

退出

munin-master 和 munin-node 上的日志未指示任何明显错误。还验证了所有主机名都是正确的 fqdn。

任何想法我错过了什么?

我检查了许多论坛和链接。但是 serverfault 不允许我粘贴两个以上的链接:
1. http://munin-monitoring.org/wiki/aggregate_examples
2. http://blog.loftninjas.org/2010/04/08/an-晚上与穆宁图聚合/

谢谢关注。

use*_*148 2

终于我成功了。Munin 并没有那么糟糕,你所需要的只是和它一起度过几个晚上。

我误解了文档,您无需提及主机名。插件名称应与 munin 节点上的插件名称完全相同。同样的插件也应该存在于带有 __ 的 Munin-master 上。

因此,在 /etc/munin/plugins 中,符号链接现在看起来像:

postgres_checkpoints__ -> /usr/share/munin/plugins/postgres_checkpoints

这是新配置,请注意“:”后面的插件名称中没有主机名:

postgres_checkpoints_total.update no  
pg_checkpoints.label Graph label  
postgres_checkpoints_total.graph yes  
postgres_checkpoints_total.graph_args --base 1000 -l 0  
postgres_checkpoints_total.cdef 0  
postgres_checkpoints_total.graph_category PG Total Checkpoints  
postgres_checkpoints_total.graph_title Aggregated checkpoints  
postgres_checkpoints_total.graph_vlabel Total Checkpoints  
postgres_checkpoints_total.checkpoints_req_total.label Total Req checkpoints  
postgres_checkpoints_total.checkpoints_timed_total.label Total Timed checkpoints  
postgres_checkpoints_total.graph_order checkpoints_req_total checkpoints_timed  
postgres_checkpoints_total.checkpoints_req_total.sum \  
        <internal_ip>.us-est-1.compute.internal:postgres_checkpoints.checkpoints_req \  
        <internal_ip>.us-west-1.compute.internal:postgres_checkpoints.checkpoints_req \  
        <internal_ip>.us-west-1.compute.internal:postgres_checkpoints.checkpoints_req

postgres_checkpoints_total.checkpoints_timed_total.sum \  
        <internal_ip>.us-west-.compute.internal:postgres_checkpoints.checkpoints_timed \  
        <internal_ip>.us-west-1.compute.internal:postgres_checkpoints.checkpoints_timed \  
        <internal_ip>.us-west-1.compute.internal:postgres_checkpoints.checkpoints_timed
Run Code Online (Sandbox Code Playgroud)

另外,请注意,现在在上面的配置中我聚合了 2 个函数。