转载请注明出处: Linux系统运维 http://www.linuxyw.com/linux/jiagou/20130420/70.html 监控,相信任何一家互联网公司都不陌生和怠慢,拿自然灾害来举例,如果不能监控,伤亡是可想而知的。当一个产品初步进入规模和稳定期,无论现在与未来,都需要一套符合产品特性并行之有效的监控体系来保驾护航,但不可能一蹴而就,必须跟随产品成长,分阶段实现和完善,关于监控定义和价值,个人的体会如下。 定义 简单理解是第一时间发现,定位并记录异常,复杂一些理解是从外部/内部、从业务/基础环境、从功能/性能、从预算/收入等各个方面对业务数据进行采集、展现和告警的体系。 价值 我们为什么需要重视监控,因为一个良好、全面、完善的业务健康立体化监控体系,能够帮助准确,及时、完善地了解业务各个层面的生存情况,并最终实现对业务的量化管理,各角色的收益如下。 1、对于运维人员,通过对各层次的数据的展示和告警设置,快速直观的发现和定位故障。 2、对于研发、测试人员,通过对各层次的数据的展示,来反应业务的容量和性能,通过设置阀值来对业务的容量和性能管理。 3、对于公司中高层,通过对各维度、各层次数据的量化,来量化业务运行的状态。 本文来自linux系统运维:http://www.linuxyw.com/linux/jiagou/20130420/70.html |