有句话叫“无监控不运维”我們在生产中,产品上线需要事先做测试我们怎么才能知道它的性能参数是否符合我们的要求,是否满足正常上线的需求就要通过监控,监控重要指标是否满足要求监控是否哪有异常,等等;
nagios:告警系统默认不提供存储系统,不能实现长期趋势显示;
Cacti:只是展示界面周期性对SNMP接口采集数据,然后数据放在mysql中展示出来;(Cron+SNMP+MySql)
Zabbix 是一个基于WEB界面的提供分布式系统监视 以及网络监视功能的企业级的开源解決方案。 监视各种参数保证服务器系统 的安全运营;并提供灵活的通知机制以让系统管理员 快速定位/解决存在的各种问题;可以实现跨機房的分布式应用监控;
系统监视: 包括监视事件和监视性能, 前者检测IIS不正常运行的原因后者用于建立用户系统性能的基准。
agent端采集数据是通过item监控项实现的;item有两个重要参数:Key和Type
Key:可以使内建命令或者远程命令(自定义的);可以带参数;每一个Key在命令行对应一个命令,可以获取到相关数据;
主动监控:由agent端主动向server端发送采集的数据;
被动监控:由server端向agent端要采集数据;
可取最近十次的平均值;
如下圖所示:收集数据信息方式:
用proxy代理收集数据可以减轻server的负担本来要与所有的agent通信采集数据,现在只需要与proxy一个通信就可以了;当然也鈳以将部分agent分给proxy部分agent分给server直接通信;
zabbix_server:服务端守护进程;接收agent发送的报告信息,任务:配置、统计数据、操作数据;
Zabbix_database:专用于存储所有配置信息以及由zabbix收集的数据;
zabbix_get:命令行工具,手动测试向agent发起数据采集请求;
zabbix_proxy:可选组件常用于分布监控环境中,代理server收集部分被监控端的监控数据并统一发给server;
zabbix_agent:agent守护进程;部署在被监控主机上(server上也要配置,被监控)负责收集本地数据并发给server或者proxy;
主机(host):被监控的物理设备实体;可由ip或者DNS名称指定;
主机组(host group):将一类主机组合,(还可以套模板----》即:使组内的主机都一样的模板(监控指標等一系列设定)方便管理);
监控项(item):每一个被监控主机上的可被采集的指标;对于监控对象,每个item都是由“key”标识的;
触发器(trigger):对采集的数据进行不合理空间评估不满足OK,满足就报警;一个表达式
动作(action):事件的处理方法通过包含操作(如发送通知)囷条件(何时执行操作);
报警升级(escalation):执行的动作:发送警报或者执行远程命令的自定义方案;
媒介(media):发送通知的手段或通道;eg:Email,SMS(目前我们大陆用不了)
通知(notification):向特定用户发送其关注的事情
采集--》判断阈值范围满足就OK,不满足就触发事件事件发生的动莋,
远程命令(remote command):预定义的命令被监控主机处于某特定条件时自动执行;
当zabbixserver定期的接收到agent发送来(sender)的采集数据后(或从agent端要(get)过來数据后),存到mysql然后进行一些计算(最大值、最小值、平均值等);但在存储之前,要先判断一下是否满足触发器定义的表达式即昰否在合理取值范围内,合理---OK不合理---Problem,一旦触发器有状态改变就会触发一个事件发生,事件会伴随着定义的一个动作(eg:执行远程命囹或者报警);过一段时间,若想查看之前的数据变化就可以打开展示接口查看;
采集---》判断阈值范围---》若是有从OK变problem或者由problem变OK的状态轉换----》触发事件的发生---》执行一些动作
版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。