欢迎大家分享自己的文档,请点击查阅:分享方法,![]() 如果你喜欢这文章,可以点击文章结尾处百度分享,分享到你的各种社区收藏,或推荐给朋友……
返回:海量运维、运营规划--linux网络架构规划首页 事件管理在于通过一套科学合理的方法论去减少或者消除存在或可能存在对服务影响的事件,可以理解为可以快速有序地对事件进行响应和处理,降低事件对服务的影响,并且记录下完整的处理过程。当互联网公司成长到一定规模后,事件管理的价值就突显出来了,比如之前的部门要支撑100+个产品,2000+台服务器,14个IDC,4条专线,120+个开发、产品,一天发生的事件较多,必需通过事件管理来提高效率及可持续性,事件管理主要有以下几个重点: 流程 事件管理通常会有一个统一入口(服务台),通过统一入口再将事件进行流水线处理。这个入口的对象就是事件来源,如用户反馈、业务监控告警、员工保障等,主要流程如下:
1、接收和记录,发现并报告事件,同时生成一个事件记录(事件单)。 影响程度 通过事件现象评估受影响的程度,例如交换机故障、IDC掉电、硬盘读写对应的影响程度是完全不同的。 紧急程度 根据事件影响程度,将事件造成的影响由高到低分为若干等级,便是紧急程度,等级越高,说明影响越大,需要优先处理。 优先级 事件基于相关配置项的紧急度和影响度进行优先级分类,优先级越高,说明产品受影响就越大,损失越多惨重。 事件录入: 事件追踪: 转载请注明linux系统运维: |