项目需求:
1、
使用开源软件Zabbix3.4.7作为核心系统;
2、
监测72台服务器,37台网络设备,16条VPN链路,13个应用系统;
3、
监测覆盖到上海和香港;
4、
需要应用状态分析及日志分析系统。
解决方案:
      对监控平台的部署(主要组件包括:Zabbix、Mariadb、Agent)安装、配置和联调,主要服务器系统Centos 7.2,Agent代理安装,支持windows、linux。信息采集手段包括:通过Agent代理、SNMP协议、和ICMP协议采集源。对OS层级的采集程序进行安装和配置,数据采集及数据采集后,执行在Zabbix界面中对所需监控的设备和指标项、告警等进行配置工作,并在Zabbix中对基础指标进行展示。对管理对象进行告警配置,包括根据自动化运维监控平台的交付件《自动化运维监控平台设计方案》中的告警机制设计进行告警设置;定义某类设备的告警信息中需要过滤的关键字;对性能、容量类指标设置阈值;对OS级别的CPU、内存和磁盘容量设置阈值告警;对交换机端口状态设置阈值告警。后期对管理员进行培训。

支持范围 监控项
服务器

Dell Linux,windows

10

主机存活状态、运行时间、CPU负载、内存使用率、磁盘使用率、网卡状态、网卡流量

交换机

H3C

30

核心层设备:设备存活状态、运行时间、CPU使用率、内存使用率、端口状态及流量

接入层设备:设备存活状态、运行时间、上联端口状态
防火墙

Fortinet

2

设备存活状态、运行时间、上联端口状态

无线AP H3C
50

设备存活状态、运行时间、接入数量

虚拟化

VMware、KVM

6

存活状态、运行时间、CPU使用率、内存使用率、磁盘使用率

应用

NetSuite,KissFlow,BambooHR, Office365, AWS Workspace, Concur


URL状态、模拟登陆、模拟退出、响应时间、下载速度  

实现效果:
1、通过自动化运维监控系统对应用所属设备横向监控及应用状态分析系统对应用架构竖向分析,提供对客户核心应用及业务系统的状态分析,同时进行海量告警收集,有助于从海量设备中快速定位到指定设备和配置,实现更加快捷的设备配置管理,帮助客户快速定位故障原因;
2、通过大数据日志实时搜索技术,运维人员可更便捷的从海量日志数据中精准检索关键的事件数据且快速获知分布在不同节点上与故障相关的系统日志,通过查看对应日志,可以提前识别安全威胁,检测异常,快速定位网络故障问题根源并跟踪关键安全事件,从而降低系统宕机时间、提升网络性能、保障企业网络安全。
截图展示:
大屏展示系统


应用状态分析系统







在线留言