当前位置: 主页 > 虚拟化 >

成功的虚拟化系统是如何炼成的?实施及运维

时间:2013-05-06 23:06来源:转载 作者:会员 点击:
作者:范军 (Frank Fan) 新浪微博:frankfan7 如果把虚拟化系统比作一座房子,好的设计就使建筑框架图,实施就要一砖一瓦的把房子搭起来。缺工减料,延误工期的后果不言自明。而运
欢迎大家分享自己的文档,请点击查阅:分享方法,Linux系统运维
如果你喜欢这文章,可以点击文章结尾处百度分享,分享到你的各种社区收藏,或推荐给朋友……


作者:范军 (Frank Fan)
新浪微博:frankfan7

如果把虚拟化系统比作一座房子,好的设计就使建筑框架图,实施就要一砖一瓦的把房子搭起来。缺工减料,延误工期的后果不言自明。而运维就是对房子的维护,改建和保养了。
本文设计篇我们讲了设计对于一个成功虚拟化系统的重要性,这只是一个好的开头。行百里路者半九十,实施及运维也要给力才成。
一   实施
架构师们,如果你真的在意你精心设计的方案,那么在实施过程中也不能松懈啊。我曾经也作过项目经理,这段经历对我在架构设计中帮助很大。架构师是项目经理的军师,你要帮助设计高效合理项目计划,并且能预计并控制风险。比如我们常见的物理机虚拟化的项目中,要考虑分阶段进行。把重要的关键服务器放在后面得到阶段,利用前期积累的经验就能将风险降低。
实施中常见的问题有:
人员浪费:有的人忙死,有的人闲死。因为项目任务的安排不合理,或者依赖条件不满足,有的人无法开始执行任务。
建议:架构师对人员的能力水平和需要的技能要有数,合理安排人员,及时向项目经理提出建议增加或者减少人员。密切关注假设条件和依赖条件是否变化,并及时应对。
 额外工作量:就算诸葛亮也有算不到的时候,再有经验的架构师也无法预计到实施中可能会遇到的特殊情况造成工作量超出预算。
建议: 可以从两个方面来着手: 一 在估计工作量是要有应急措施并且预留资金,以备不时之需。 二  工作量增加是由什么因素造成的? 是由于当初的假设条件不成立,还是新增的需求,还是技术问题没有考虑到等等。如果在合同中对假设和需求有清晰的说明,就不至于被动。
测试不完善或者过度测试:
测试很重要,却往往容易被忽视。有时会因为时间压力跳过一些重要测试,有时也因为过度模式化,而在测试上花费太多人力及时间。
建议:测试人员提前进入状态,制定精简并充分的测试计划。尽可能把大的测试任务分离成小的测试任务,缩短测试及反馈周期,能及时修正发现错误。避免在后期才发现重大问题,造成时间的延误和前期工作的浪费。虽然敏捷多应用于软件开发,不妨在虚拟化项目中也考虑哪些测试可以借鉴敏捷的理念。
实施与设计不符
参与实施的人员可能很多,互相的合作有可能不足,也有实施人员的经验和能力的限制,没能很好了解设计意图。
建议:一个完善的可执行的安装文档可以避免这个问题。文档中特别表明针对需求所定制的部分,以及配置的细节、参数等等。
 二  运维
项目实施完是不是就完事大吉了?庆功酒喝完后还得想想怎么能顺利得移交项目,并且帮助支持部门把这个系统管好。
一个好的系统,如果没有完善的管理,没过多久就会漏洞百出。运维指导应该规范运维中的关键几个方面:
权责分明  (Role & Responsibilities)
别随便给管理员权限,别以为这是信任同事,你可能好心办坏事,权限意味着责任。知识能力不具备的人得到过多的权限,也多了犯错误的机会,反受其害。
谁有什么权限,应该一清二楚,并尽量流程化,规范化。人员入职离职,权限需要及时更改。
权责分明也降低了由于人为失误造成的风险。
 容量管理(Capacity  Management
人们往往对虚拟化平台有个误区,认为不需要额外购买硬件,有需求就建虚拟机呗。常常见到大量的虚拟机没能很好利用,过度浪费服务器资源,造成整个平台性能下降。
建议: 规范虚拟机的配置,比如设定初级(1vCPU 4G)、中级(1vCPU 8G)和高级 (2vCP, 16G)供用户选择。缺省1vCPU,用户要求多vCPU时要具体问题具体分析。是否应用支持多CPU,是否该服务器能有效支持。在CPU调度时,有些情况多CPU VM无法快速获得申请的资源,等待时间延长,性能反而更差。
vCenter  Operation Suite 可以很好的帮助容量管理。
问题管理 (incident/problem  Management
小问题如果不及时补救会成大患。有时迫于时间压力,我们会采取一些措施暂时解决表象问题,可是没有能分析根本原因。这样你就会成为一个救火队员,每天忙得要死,还没人领情。有VM出现性能问题,vMotion到另外主机暂时缓解。可有可能一段时间后会拖垮那台主机。
变更管理 (Change Management)
因为变更失误造成灾难性的事件屡见不鲜,对于运行关键业务的虚拟化平台,变更管理必不可少。
运维人员是要充分理解架构设计原意的。否则开始平常的改动可能和原来的设计冲突。比如管理员添加了备份Port  Group,  和工作网络的Port Group共享一个上行物理网卡。 一到备份任务运行的时候,就会发现虚拟机上的应用程序极慢。因为备份抢占了网络带宽。
在存储管理员更改存储设备时,虚拟化管理员要评估对平台带来的影响。
自动化 (Automation
有些系统管理员每天埋没于很多重复的任务之中,比如创建新用户,建虚拟机,出报告等等,其实很多都可以自动化的。即减少了人为错误,也能有时间花在更有意义的工作上。何乐而不为?
造就一个成功的虚拟化平台,靠的是项目经理,架构师和整个团队的不懈努力。 只要你能考虑到设计,实施及运维中的重要方面,成功还会远么?
如果您希望更多了解虚拟化设计,大中国区首场攀顶云端尖峰认证,备战VCDX专题讲座” 将在2013320VMware合作伙伴大会上隆重推出,地点:北京JW万豪酒店。 届时张纲、@FrediYao和我@frankfan7将面对面和您一起探讨.

上一篇:设计篇
 


本文出自 “坐看云起” 博客,请务必保留此出处http://frankfan.blog.51cto.com/6402282/1157145

转载请注明linux系统运维
http://www.linuxyw.com/linux/xunihua/20130506/230.html

------分隔线----------------------------
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
验证码: 点击我更换图片