2016年1月,国家产业服务平台“创新赢未来”2015年终评选结果公布,中国人民财产保险股份有限公司的“PICC南中心服务器管理系统”经过专家组评审,荣获“2015年度中国IT监测运维领域最佳产品奖”。
人保财险从2011年开始启动信息系统全国大集中项目,只用了不到一年的时间完成了全国信息系统的上收工作,涉及39家省级分公司超过1400套系统的迁移和集中运行。目前人保财险南中心作为公司的生产运行中心,为公司超过2800亿年保费规模的业务提供支撑和保障。
信息设备及信息系统的全国大集中,在技术风险可控性以及技术资源保障性方面提升的同时,风险集中的问题也随之而来。特别是在人保财险南中心,集中运行着超过2200台不同品牌、不同类型的硬件设备,虽然在架构上通过楼层间双活部署,虚拟化应用,热备等技术保障生产系统的高可用性。但随着硬件设备的正常损耗以及日趋老化,设备的可靠性将进一步降低,故障率将历年急剧上升,导致在某个时间段内出现运行单点风险,甚至更大的生产安全隐患。
人保财险南中心在2015年开始建设“PICC南中心服务器管理系统”,实现了南中心超过1800台设备的接入,涉及不同品牌,不同型号的小型机、刀片式服务器、存储设备、网络设备、光纤交换机和磁带库等设备。设备接入率超过80%,涉及的配件监控点超过20万个,涉及的监控参数超过100万个。
在统一的监测以及数据收集的基础上,服务器监控系统实现了硬件设备隐患的及时告警,在机房现场人工巡检的基础上,提供了更及时的隐患预知,更快速的故障告警,更精确的问题定位,结合人保财险的一体化运维体系和系统,实现短信、邮件告知,工单自动触发,提升故障处理流程效率。
在系统建成上线后,每周通过服务器管理系统发现的硬件隐患或硬件故障超过20起,故障发现的时间较原来人工机房巡查缩短10倍以上,使南中心硬件设备隐患在发展成故障,甚至影响到业务生产之前,得以及时排查,大大增加了硬件故障风险隐患的可控性。在全面精细化的监测手段和配套体系化运维流程的支持下,南中心实现了硬件设备从被动式故障处理到主动式健康管理的全面提升,为人保财险高速发展的业务规模提供坚实的保障。