当前位置: 主页 > 网络架构 >

网络监控,时刻掌控网络变化

时间:2013-05-05 16:35来源:www.itkoala.com 作者:itkoala 点击:
中国具有世界上最复杂的基础网络,有甚至调侃说,世界上最远的距离是电信与联通的距离,也不无道理,网络层是介于用户层与应用层、系统层之间的,如果网络层出现波动,将直接
欢迎大家分享自己的文档,请点击查阅:分享方法,Linux系统运维
如果你喜欢这文章,可以点击文章结尾处百度分享,分享到你的各种社区收藏,或推荐给朋友……


返回:海量运维、运营规划--linux网络架构规划首页
中国具有世界上最复杂的基础网络,有甚至调侃说,世界上最远的距离是电信与联通的距离,也不无道理,网络层是介于用户层与应用层、系统层之间的,如果网络层出现波动,将直接影响用户的体验,严重的网络故障,甚至可以导致产品不可用,所以前期对IDC的规划要有容灾考虑外,运营阶段更需要及时了解IDC的健康状态,通常IDC故障具有以下几点属性:

1、历史遗留的瓶颈,运营商基础架构更新慢且带宽交互仅在北京进行,日常交互带宽利用率90%以上,不堪重负,电信、网通骨干网忙时平均利用率超80%,负荷高,上层链路拥塞家常便饭,跨运营商问题层出不穷。

2、突发性、人为性,业务规模从小到大(数千台服务器),不可避免出现跨机架、跨交换机、跨机房、跨城域网,网络设置升级变更及施工极其容易造成网络故障,数次遇到因施工、修路挖断光缆造成网络波动、中断。

3、政治色彩,重大事件前,如奥运、亚运、每年的二会等,都会对网络做较大的调整和过滤,造成网络不稳定。

综上所述,如果能通过监控网络,选择最优,最稳定的IDC具有重要意义的同时,能及时发现突发的网络故障,也能减少损失和快速恢复故障。监控的方法个人体会按颗粒度,由大到小比较合适,具体如下所示:

一、第三方监控(以Networkbench为例)

1、IDC维度,个人认为Networkbench的IDC(包含CDN)监控是非常真实的,数据产生于真实浏览器,并且具有高可定制性,可以针对IDC趋势、对比,分运营商,分省份,分时段的IDC质量对比,经过实践,能很及时的监控到网络延时、故障等。

2、ISP维度,Networkbench覆盖数十种运营商,对运营商覆盖分析及IDC分布、测试具有非常大的帮助,趋势、对比非常直观。

3、省份维度,Networkbench全国地图展现各省份的网络速度是非常有名的,通过颜色展现各省网络覆盖状况,实时刷新,一目了然。

linux系统运维

二、自建监控(JS上报方式,以用户所在的省份为中心)

1、IDC的省份维度,数据来源自身业务上报的数据,不能代表用户真实体验,但具有衡量作用,以图为各省到各IDC的速度,可以看出某省到省IDC速度最快,某IDC覆盖某些省份最优,当某省10分钟内上报失败率达到10%时,告警等。

下图是对IDC出口带宽的监控,以商务带为100%计算,当达到商务带宽的90%告警,部分突发业务会超出商务带宽,甚于会造成IDC出口拥塞,对IDC出口监控是具有重要意义的。

2、ISP的省份维度,通常我们最想知道,业务覆盖电信、联通、移动、教育网的质量如何,看否存在问题,是否有优化空间,其实真真将颗粒再缩小些,我们应该关心具体的省份的各ISP的覆盖质量如何,从而通过GSLB的解析策略做微调,如下图所示。

3、区域省份维度,因为IDC具有区域的特性,通常一个网站85%以上是静态内容,85%速度又受静态内容影响,所以大区IDC+CDN分布将内容推送到用户最近是提升速度比较有效的方法,如果监控到区域各省到某IDC的速度,将IDC不能覆盖,或覆盖差的解析给CDN,是不错的选择,当然长期观察IDC区域覆盖质量更重要。

最后分享一个IDC间监控的方法,主要有内网专线、外网通信质量,可以在多个IDC中找耦合度最高的一个IDC,比如数据中心,从这个IDC向外持续ping或,拉取大小不同的文件,将返回时间记录和视图化,必需要实时和能看到趋势。

 

转载请注明linux系统运维
http://www.linuxyw.com/linux/wangluojiagou/20130420/78.html

------分隔线----------------------------
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
验证码: 点击我更换图片