当前位置: 主页 > 网络架构 >

监控体系和实现途径

时间:2013-05-05 16:36来源:www.itkoala.com 作者:itkoala 点击:
监控的核心作用是对业务具有诊断能力,通过掌握生产环境下的多个维度数据,按照一定的监控模型,对影响运营质量的诸多要素和运营过程的各个环节,进行监控、采集、建模、展现
欢迎大家分享自己的文档,请点击查阅:分享方法,Linux系统运维
如果你喜欢这文章,可以点击文章结尾处百度分享,分享到你的各种社区收藏,或推荐给朋友……


返回:海量运维、运营规划--linux网络架构规划首页
监控的核心作用是对业务具有诊断能力,通过掌握生产环境下的多个维度数据,按照一定的监控模型,对影响运营质量的诸多要素和运营过程的各个环节,进行监控、采集、建模、展现,通过监控来量化产品运营状况和确保最佳用户体验,监测通常分为以下两类,详细如下所示。

1、按终端划分,可分为互联网(PC)和移动互联网(手机),侧重用户,通过采集用户各终端、各浏览器下的访问数据来追踪产品的健康状态。

2、按层次划分,可分为用户层、系统层、网络层、应用层、数据层等,可以根据架构和应用分类定制多样的,且具有针对性的监控手段,详细分类汇总如下表。
 

监控对象 监控对象子项 监控维度 相关指标
服务器 CPU 利用率
负载
单核利用率
1分钟采集,最长5分钟告警
内存 利用率 1分钟采集,最长5分钟告警
磁盘 分区使用率
只读状态
block in/out
I/O服务时间,
I/O等待时间,
I/O队列长度
HP硬盘监控
DELL硬盘raid状态监控
1分钟采集,最长5分钟告警
网卡 流量
包量
1分钟采集,最长5分钟告警
网络连接 监听端口 5分钟检测
可连通性 ping检测,ssh连接 3分钟检测
存储设备 磁盘 设备异常 每分钟检查异常邮件
网络设备 CPU 占用率 5分钟采集和告警
防火墙 Session数 5分钟采集和告警
连通性 ping状态 3分钟检查
设备日志信息 异常日志 每分钟检查
网络设备SNMP数据 设备端口的出入流量、包量、
启动时间、错误包数;可自定义添加
5分钟采集和告警
网络质量 延时 IDC特定IP间的延时数据 5分钟采集和告警
丢包 IDC特定IP间的丢包数据
交换机流量 IDC的交换机的流量之和
网卡流量 IDC所有服务器的网卡流量之和
Netflow流量 网络设备netflow协议数据
业务监控 进程 进程存在性 1分钟检查
端口 端口存在性 5分钟检查
网卡流量 业务所有服务器网卡流量之和 5分钟检查
业务自定义特性监控 自定义特性 自定义

转载请注明linux系统运维
http://www.linuxyw.com/linux/wangluojiagou/20130420/71.html

------分隔线----------------------------
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
验证码: 点击我更换图片