服务器监控的良好介绍?

前端之家收集整理的这篇文章主要介绍了服务器监控的良好介绍?前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
我目前正在使用 Linux,Apache,Django和 MySql开发一个小型Web应用程序.

作为一名对Linux / shell脚本/服务器监控知之甚少的开发人员,我不知道我想要做什么样的监控…但是,我喜欢做的一些事情是:

>轻松访问cpu /内存使用的时间序列.
>每当服务器资源被滥用时发出警报.
>轻松访问apache日志文件,并能够使用它们进行快速分析.

另外,我想知道是否还有其他日志文件/服务我应该留意?

解决方法

服务器监控取决于哪些指标对服务器的用途很重要.作为一个Web应用程序,有很多方面需要介绍.你可以想到无数的指标,但你通常会有这些最低限度的指标:

>服务器和服务的可用性
>磁盘空间&用法
>网络使用情况
>内存使用情况
> cpu使用率
>日志文件

除了查看现在之外,监控的另一部分是记录过去.这使您能够:

>规划未来
>找出问题弹出的原因

您是否会在未来两个月内以相同的增长耗尽磁盘空间?您是否看到cpu使用率的增加与新功能部署一致?为什么用户必须等待四秒才能查看页面

我将介绍上述每个指标:

可用性

非常简单的可用性监视是通过ping命令进行的,但服务器ping这一事实并不意味着Web服务器之类的服务可用,因为它可能已经崩溃.更复杂的监控是每小时在网站上运行一次测试交易,以确保用户可以购买产品.

磁盘空间和使用情况

空间指标很明显,在应用程序停止工作之前,您需要提前知道.使用部分有点复杂.用法将是字节读/写,每秒输入/输出操作等指标.这些可能很重要,因为如果您发现与磁盘性能下降相关的站点延迟增加,您可能已经开发了一个需要多个磁盘的坏磁盘寻求或读取以满足请求.不要忘记测量inode的使用情况,这是我在OpenVZ中忘记了几次的指标.

网络使用

达到网络带宽限制?您是否看到了ISP所看到的相同数字?

内存使用情况

当系统开始耗尽内存时,它将开始交换.这会影响性能.

cpu使用率

在高峰时段cpu是否飙升100%?也许您可以通过将服务器升级到更快的cpu或更多cpu来改善用户体验.性能是否会因cpu必须处理如此多的网络控制器中断而死亡?也许是时候投资购买TCP卸载卡了.

日志文件

> MysqL查询日志:查询运行速度低于阈值.查看此文件并根据需要进行改进.如果你无法改进它们并且查询时间与繁重的系统负载相对应,那么可能需要时间进行升级.
>应用程序的日志文件:正在使用什么导致所有繁重的系统负载?他们中的大多数人都在查看特定页面吗?为什么今天只有一半的用户上传工作?
> Apache日志文件:了解这些数字对于网站设计效率,可用性,广告活动测量,破损页面或图像等非常有用.
>系统的日志文件:黑客尝试,硬件错误,各种守护进程消息.

通常最好将系统日志发送到另一台服务器,以便无法覆盖轨道.

除此之外,还有许多可以监控的事情:每秒事务数,服务器温度,硬盘温度和温度. SMART,RAID状态,备份报告,批处理作业状态,

工具

有很多工具可以完成上述某些工作.其他更具体的指标要么需要自我编码,如果还没有可用(通过SNMP显示qmail队列大小就是我放在一起的一个这样的指标,因为有时qmail会半休息,仍接受新电子邮件但不发送任何).

我使用的一些工具可以轻松开始:

> NagiosIcinga – 最受欢迎的* nix监控工具之一.相当多的监控工具,比如MysqL slave的监控.我通常将此专门用于所有服务的可用性监控.设置为电子邮件发送电子邮件至电子邮件地址以发送警报. Icinga是Nagios的一个分支.浏览器通过“命令”查看可以使用的命令.
> Munincollectd – 这些为您提供图表.在CentOS上轻松设置.为缓冲区使用等数据库洞察设置MysqL监控插件.
> WebSitePulse – 请注意,只有远程完成时,可用性监控才是最佳选择.我使用他们的POP3监控来验证Nagios是否仍然通过我制作的脚本运行.
> AWStats – 将Apache日志文件处理为报告.
> Google Analytics – 更多客户端详细信息,不在常见的Apache日志中,如屏幕分辨率和颜色深度.

猜你在找的Linux相关文章