主
将节点添加到/etc/munin/munin.conf
[server.example.org] address private.server.example.org
master的html目录是(匹配apache配置):
htmldir /opt/munin
ls -lh /opt/munin/ drwxr-xr-x 20 munin munin 4.0K 2011-11-07 16:15 example.org <= FOLDER NAMED AFTER OUR DOMAIN -rw-r--r-- 1 munin munin 2.5K 2010-08-03 14:11 definitions.html -rw-r--r-- 1 munin munin 3.0K 2010-08-03 14:11 favicon.ico -rw-r--r-- 1 munin munin 15K 2011-11-07 16:21 index.html <= MAIN MUNIN PAGE -rw-r--r-- 1 munin munin 1.8K 2010-08-03 14:11 logo-h.png -rw-r--r-- 1 munin munin 473 2010-08-03 14:11 logo.png -rw-r--r-- 1 munin munin 5.6K 2010-11-03 14:07 style.css
index.html的页脚表示此文件是由munin动态生成的,所以我知道我不必触摸此文件.
This page was generated by <a href='http://munin-monitoring.org/'>Munin</a> version 1.4.4 at 2011-11-07 16:21:30+0000 (UTC)
域目录包含所有节点的文件夹.我最终为新节点创建了一个希望它会有所帮助,但它没有任何区别
mkdir /opt/munin/example.org/server.example.org chown munin:munin -R /opt/munin/example.org/server.example.org
我杀了munin-cron并重新启动它,但也没有任何区别.
$sudo su munin munin-cron start $sudo ps aux | grep munin-cron munin 26566 0.0 0.2 4092 584 ? Ss 16:35 0:00 /bin/sh -c if [ -x /usr/bin/munin-cron ]; then /usr/bin/munin-cron; fi munin 26567 0.0 0.2 4092 576 ? S 16:35 0:00 /bin/sh /usr/bin/munin-cron
Munin节点
安装的munin-node包
apt-get install munin-node
修改了/etc/munin/munin-node.conf文件以允许来自munin master的accces
host * allow ^A\.B\.C\.D$ # master IP address port 4949
重新启动munin节点
service munin-node start
如果我在新节点上运行tcpdump,我可以看到一些数据正在与主服务器交换,所以我相信在这一点上问题在于配置主服务器.
有什么想法,我正在发布什么或如何进一步解决这个问题?
其他疑难解答
据我所知,我检查了日志
$grep server.example.org /var/log/munin/munin-update.log
2011/11/08 08:40:03 [WARNING] Config node server.example.org listed no services for server.example.org. Please see http://munin-monitoring.org/wiki/FAQ_no_graphs for further information. 2011/11/08 09:10:02 [INFO] Reaping Munin::Master::UpdateWorker<example.org;server.example.org>. Exit value/signal: 0/0
警告将我带到了这个页面http://munin-monitoring.org/wiki/FAQ_no_graphs.我按照建议给出了一步一步的步骤.虽然符号链接似乎是正确创建的,但我确实运行了命令munin-node-configure –shell | sh -x相信修复了这个问题.前面提到的页面也建议更改我所做的set host_name(虽然我不相信它有帮助,因为其他工作节点没有配置它).
到达目的地时,telnet故障排除是成功的
$telnet private.server.example.org 4949 Trying A.B.C.D... Connected to private.server.example.org. Escape character is '^]'. # munin node at server.example.org > nodes server.example.org . > list server.example.org cpu df df_inode entropy forks fw_conntrack fw_forwarded_local fw_packets if_err_eth0 if_err_eth1 if_eth0 if_eth1 interrupts iostat iostat_ios ip_A.B.C.D irqstats load memory open_files open_inodes postfix_mailqueue postfix_mailvolume proc_pri processes swap threads uptime users vmstat > fetch df _dev_sda1.value 23.1295909196156 _dev.value 1.2890625 _dev_shm.value 0 _var_run.value 0.00782368542525642 _var_lock.value 0 _lib_init_rw.value 0
>阅读munin-master上的日志. /var/log/munin/munin-update.log是开始的地方.如果您有条目确认更新成功,并且您在/ var / lib / munin /中获得了rrd文件 – 请继续使用munin-graph.log和munin-html.log
>验证主服务器是否能够连接到munin-node的地址.请使用netcat或类似方法进行测试:nc private.server.example.org 4949.预期输出应为:主机名中的#munin节点.可能的错误是防火墙丢弃的数据包(而nc将在connect()处挂起,如果使用strace则可见),或者无法解析名称(而netcat输出nc:getaddrinfo:名称或服务未知).
如果在尝试上述操作后找不到任何内容,请从主服务器上粘贴一个完整的munin.conf,(如果必须,将数字IP地址与数字匿名,主机名包含一些虚假文本).
不太常见的错误; root用户可能在某些时候调用了cron-job,其中某些文件具有root权限,并且munin-user无法更新,他们通常需要对/ var / lib / munin中所有文件的写访问权限和html目录.