Linux系统运维:http://www.linuxyw.com,QQ交流群:244914685

Linux系统运维

当前位置: 主页 > 架构 >

可伸缩、可调度、可扩展

时间:2013-04-20 11:43来源:www.itkoala.com 作者:itkoala 点击:
汶川地震是唐山地震后中华民族最大的天灾,让人感叹灾难面前,基础设施是如此的脆弱,交通瘫痪、电力瘫痪、通信瘫痪,也让我们思考我们的系统、产品在各类故障面前是否能够做

转载请注明出处: Linux系统运维 http://www.linuxyw.com/linux/jiagou/20130420/38.html


汶川地震是唐山地震后中华民族最大的天灾,让人感叹灾难面前,基础设施是如此的脆弱,交通瘫痪、电力瘫痪、通信瘫痪,也让我们思考我们的系统、产品在各类故障面前是否能够做到可用,先看几个本人经历过的案例:

1、200X年1月10日19时25分,深圳枢纽8楼IDC电信6509核心设备受到网络攻击流量急速下降,历时62分钟才恢复,1075万用户受影响,基本不可用。

2、200X年6月5日20时50分,深圳电信龙岗IDC网络设备板卡怀疑存在问题外网出口流量下降10G,历时60分钟才恢复,168万用户受影响,基本不可用。

3、200X年12月18日8时15分,qq.com北京地区用户无法打开qq.com页面, 历时195分钟才恢复,影响北京地区、上海地区和西安地区,无法访问qq.com。

互联网灾难如同现实一样不可抗性,于是出现一些新的名词,“柔性可用”、“有柔可损”、“全网调度”,顾名思义这些名词都围绕当偶见灾难性故障时,如何保护用户的体验,下面结合自己的一些理解分享一些体会。

可伸缩

可伸缩=能屈能伸的服务,当发生骨干网或IDC级的故障时,肯定是区域级别的服务不可用,或数十上百台服务器不可用,此时如何在用户量不变的情况下,仍然能够保障用户的体验,我们看腾讯IM、SNS两大平台是如何做的。

1、QQ基于用户行为模式伸缩服务,将服务分为若干级别,不同故障可以触发提供相应级别的服务,比如当区域IDC故障时,可以提供没有语音、视频、传输文功能的IM服务,如果90%的IDC、服务器故障,可以只提供只能收、发消息的IM服务,如果按传统模式,有10%的服务受影响就会影响整体个产品的使用,详细分级如下图所示:

2、QQ空间故障梯度伸缩服务,100%带宽、最优服务,80%带宽、取消增值体验,50%带宽、保证基础功能,20%带宽、提供核心功能,5%带宽、公告页面,通过故障梯度服务柔性的将故障对产品的影响消化掉,与故障直接伤害用户相比,伸缩服务几乎不影响用户的体验。

可调度

可以理解为通过流量的自由调整对抗网络、IDC的硬件故障,用户都是通过GSLB被引导、解析到最优的ISP、IDC、服务器,当某ISP的骨干网、某ISP的区域IDC、某IDC的服务器出现故障时,可以通过GSLB迅速将故障对应的ISP、IDC的服务器IP从GSLB中摘除,用户被解析到正常的服务器,从而不至于受到影响。实现可调度的前题是系统架构要考虑多ISP、多IDC的分布,详细分布策略如下图所示:

可扩展

可扩展是建立在系统架构横、纵向的可伸缩、可调度的基础之上,更多的是在可伸缩、可调度的反面,将系统拉伸和柔性扩大,将调度能力更精细化。例如,QQ.com,经历一、二次优化,通过高性能、高可用架构升级并实现电信、联通、教育网、移动14个IDC覆盖,实现大区、IDC级容灾,当IDC故障发生时,可以3分钟内迁移、调试数10G的流量。

本文来自linux系统运维http://www.linuxyw.com/linux/jiagou/20130420/38.html

顶一下
(0)
0%
踩一下
(0)
0%
分享按钮
------分隔线----------------------------
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
验证码: 点击我更换图片