linux – 有人可以解释默认的munin图的“用例”吗?

前端之家收集整理的这篇文章主要介绍了linux – 有人可以解释默认的munin图的“用例”吗?前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
安装munin时,它会激活一组默认插件(至少在ubuntu上).或者,您只需运行munin-node-configure即可确定系统支持哪些插件.这些插件中的大多数都绘制了直接数据.我的问题不是解释数据的性质(嗯……也许是某些人),但你在这些图中寻找的是什么?

很容易安装munin并看到花哨的图表.但是拥有图表并且无法“阅读”它们会使它们完全失效.

我将列出在我的系统上默认启用的标准插件.所以这将是一个很长的清单.为了完整起见,我还将列出我认为理解的插件,并简要说明我认为它用于什么.如果我对他们中的任何一个错了,请更正.

那么让我将这些问题分为三个部分:

>我甚至不了解数据的插件
>插件,我了解数据,但不知道我应该注意什么
>我认为理解的插件

我甚至不了解数据的插件

这些可能包含不一定仅针对munin的问题.不理解数据通常意味着操作系统/硬件基础知识的差距….;)随意回答“giyf”答案.

这些插件我只能猜到发生了什么……我几乎不想看这些“猜测”……

>每台设备的磁盘IO(IOs /秒)什么是IO.我知道它代表输入/输出.但就目前而言.
>每台设备的磁盘延迟(平均IO等待)不知道“IO等待”是什么……
> IO服务时间这是一个巨大的混乱,几乎不可能在图中看到一些东西.

插件,但不知道我应该注意什么

> IOStat(块/秒读/写)我假设,这里要注意的是尖峰?这意味着该设备正在大量使用?
>可用熵(字节)我假设这对随机生成很重要?我为什么要这个图?到目前为止,价值总是接近恒定.
> VMStat(运行/ I / O睡眠过程)这个和“进程”图之间有什么区别?两者都显示运行/休眠进程,而“进程”图表似乎有更多细节.
>每台设备的磁盘吞吐量(读/写字节数/秒)这个与“IOStat”图之间的差异是什么?
> inode表用法我应该在此图表中查找什么?

插件,我认为理解

我会在这里猜一些事情……如果我错了,请纠正我.

>磁盘使用百分比(百分比)使用/剩余磁盘空间.当这接近100%时,您应该考虑清理或扩展分区.这对根分区非常重要.
>防火墙吞吐量(数据包/秒)通过防火墙的数据包数.如果这种情况持续较长时间,则可能是DOS攻击的迹象(或者我们只是收到一个大文件).它还可以让您了解防火墙性能.如果它升级并且您需要更多“功率”,则应考虑负载平衡.如果它正在趋于平稳并且看到与cpu负载的相关性,那么也可能意味着您的硬件速度不够快.磁盘使用情况的相关性可能指向FW配置中过多的LOG目标.
> eth0错误(数据包输入/输出)网络错误.如果此值增加,则可能是硬件故障的迹象.
> eth0流量(位/秒输入/输出)原始网络流量.这应该与防火墙吞吐量相关联.
>线程数不断增加的值可能指向一个没有正确关闭线程的进程.调查!
> processesBreakdown活动进程(包括休眠).这里的快速尖峰可能指向一个叉炸弹.缓慢但不断增加的值可能指向应用程序生成子流程但未正确关闭它们.调查使用ps faux.
>进程优先级这显示了进程优先级的分布.只有高优先级的流程并没有多大用处.考虑取消优先排序.
> cpu usage完全直截了当.如果这是尖峰,您可能正在进行攻击,或者进程正在占用cpu.如果它在正常操作中缓慢增加并接近最大值,则应考虑升级硬件(或负载平衡).
>文件用法主动打开文件数量.如果达到最大值,则可能会打开一个进程,但无法正确释放文件.
> load average显示系统负载的汇总值.应该与cpu使用率相关联.增加的价值可能来自许多来源.寻找与其他图表的相关性.
>内存使用情况内存的图形表示.只要你有很多未使用的缓存缓冲区就可以了.
> swap in / out显示交换分区上的活动.这应该始终为0.如果您看到活动,则应该为您的机器添加更多内存!

解决方法

Disk IOs per device (IOs/second)

对于传统硬盘,这是一个非常重要的数字. I / O操作是对磁盘的读或写操作.使用旋转主轴,您可以从几十到每秒200 IOPS左右,具体取决于磁盘速度和使用模式.

这不是全部:现代操作系统确实有I / O调度程序,它们尝试将多个I / O请求合并为一个并以此方式加快速度. RAID控制器等也会执行一些智能I / O请求重新排序.

Disk latency per device (Average IO wait)

从执行I / O请求到单个磁盘到实际从那里接收数据所花费的时间.如果它在几毫秒左右徘徊,你可以,如果它是几十毫秒,那么你开始看到你的磁盘子系统出汗了,如果它是几百毫秒,你遇到了大麻烦,或者至少有一个非常非常非常慢的系统.

IO Service Time

磁盘子系统(可能包含大量磁盘)的整体性能如何.

IOStat (blocks/second read/written)

每秒读/写多少磁盘块.寻找尖峰和平均值.如果平均值开始接近磁盘子系统的最大吞吐量,则需要计划性能升级.实际上,在那之前计划那样.

Available entropy (bytes)

一些应用程序确实想要获得“真正的”随机数据.内核从几个来源收集“真正的”随机性,例如键盘和鼠标活动,许多主板中的随机生成器,甚至是视频/音乐文件(video-entropyd和audio-entropyd都能做到这一点).

如果您的系统耗尽了熵,那么应用程序希望数据停止,直到获取数据为止.就个人而言,我已经看到了Cyrus IMAP守护进程及其POP3服务的发生;它在每次登录之前生成一个长的随机字符串,并且在很快就消耗了熵池的繁忙服务器上生成.

解决该问题的一种方法是将应用程序切换为仅使用半随机数据(/ dev / urandom),但这不再是这个主题.

VMStat (running/I/O sleep processes)

之前没有想过这个,但我认为这会告诉你每个进程的I / O统计信息,或者主要是它们是否正在运行某些I / O,以及该I / O是阻止I / O活动还是不.

Disk throughput per device (bytes/second read/written)

这纯粹是每秒读取/写入的字节数,更常见的是这种形式比块更易于读取,这可能会有所不同.由于使用的磁盘,使用的文件系统(及其设置)等,块大小可能不同.有时块大小可能是512字节,其他时间是4096字节,有时是其他东西.

inode table usage

对于具有动态inode(例如XFS)的文件系统,什么也没有.对于具有静态inode映射(例如ext3)的文件系统,一切.如果你有静态inode,庞大的文件系统和大量的目录和小文件的组合,你可能会遇到这样一种情况:你不能在该分区上创建更多的文件,即使理论上会留下大量的可用空间.没有免费的inode ==糟糕.

猜你在找的Linux相关文章