“很多互联网安全信息防护因投入资金量大而被忽视,很少有公司真正去做好这一块”。
12个小时!携程在5月28日尴尬地创下了国内互联网+公司系统瘫痪的新纪录。
当天上午11:09,携程网站和APP全线瘫痪,多项功能无法使用,直至晚上11时,部分功能才得以修复。从瘫痪到修复,携程“宕机”近12小时。若按携程一季度营收3.37亿美元估算,“宕机”一小时的平均损失为106.48万美元,12个小时算下来总损失超过1200万美元。
对于“宕机”的原因,坊间流传系内部员工报复所为。携程方面也两次作出解释:中午12:38,携程先是称“因部分服务器疑似遭到不明攻击所致”;次日凌晨,携程又宣布此次事件系内部人员错误操作导致。两次解释,理由不同。对此,携程公关部石凯峰在接受时代周报记者采访时表示:“服务器攻击可以来自内部或者外部,此次主要是携程内部技术人员删除了生产服务器上的执行代码所致。”
上海当地一知名软件企业高管向时代周报记者分析说:“生产服务器代码属核心服务器之一,只有权限较高的管理人员可以操作。一般网络公司会对这类代码备份,恢复系统并不会需要太长时间。而从携程”宕机“12个小时来看,携程很有可能没有备份或备份遭删除。”
“技术操作不严格和管控流程不细,或许也是原因之一。”酷鸟创始人魏建告诉时代周报记者,“携程估计因为漏洞被‘黑客’设计了后门,持续删除代码,才导致系统无法发布。许多公司在设计系统的时候从未考虑过会全盘崩溃、整个代码丢失的情况,但真的发生之后,后果不堪设想。”
实际上,从今年1月起,乌云平台就已经曝光了超过十次携程的漏洞,包括撞库、官方邮件劫持、内部员工邮箱历史信息泄露、信息泄露,但携程的回应大多是“厂商忽略”。
真实原因仍扑朔迷离
5月28日,遭遇噩梦的不仅只有股市,还有携程。
时代周报记者在第一时间发现之后,点击携程官方网站,页面显示404报错,点击“返回首页”后依然可进入携程,但其功能和其他链接均无法使用;APP的酒店查询页面则显示“Error 503 Service”,其他业务线的产品均不能查询和预订。携程此番“宕机”范围覆盖全国范围,网站及APP处于全线崩溃状态。因携程未在第一时间公布原因,随后,各种猜测甚嚣尘上。
一则消息在风传:携程数据库被物理删除(指文件存储所用到的磁存储区域被真正地擦除或清零,不可恢复).
“宕机”一个半小时后的12:38,携程首次回应媒体称:因部分服务器疑似遭到不明攻击,携程官方网站及APP于11:09起无法正常使用。目前,系统正在逐步恢复中。经紧急排查,携程数据没有丢失,预订数据也保存完整,正在恢复过程中。对用户造成的不便,我司深表歉意。
回应中的“疑似”二字,引发了更多网友的猜测。
一位自称为携程员工的网友爆料:“网站根目录被删除,所有节点上的业务代码包括发布日志都被干掉了,个人猜测是有人内部报复。”另有网友分析,携程数据庞大,从外部直接攻击的难度可想而知,应该是内部人员动了“手脚”,“最大的可能性是某人破解公司内部密码和验证条件,放置了某些恶意程序”。
“大部分情况下,互联网+企业都能在第一时间解决技术性问题。如果第一时间无法解决,也会说明故障原因,以此来打消公众的猜测和恐慌。多个途径的消息都显示此事系内鬼所为,而不是外界因素,也有点蹊跷。”速途研究院院长丁道师告诉时代周报记者。
“如果真是内部人搞破坏,这就难以阻止了,只能用法律责任以及相关的流程控制,以此降低风险和损失。”一名旅游网站的创始人分析道。
艺龙、同程受牵连
当天下午3:00,携程的官网及APP查询和预订服务仍未恢复。刚刚收归携程门下的艺龙,暂时承担起了崩溃后的导流任务。
就在携程导流艺龙两个小时后,艺龙首页也无法正常访问;几乎同时,同程旅游因接入携程的酒店数据,酒店预订服务也出现瘫痪。去年4月,携程以逾2亿美元的价格战略投资同程,成为其第二大股东。
对于同程和艺龙网站短时间崩溃的原因,华南地区一名从事互联网信息安全的人士分析说:“携程过大的流量导入,使得同程和艺龙首页的承压过大而致首页崩溃,艺龙最后借助腾讯的流量清洗系统解决了该问题。”
“宕机”近11个半小时后,携程在官方微博上发布声明称:5月28日22:45,经抢修,除个别业务外,携程官方网站及APP恢复正常。经过排查,携程郑重声明数据没有丢失,预订数据也保存完整。对用户造成的不便,携程再次深表歉意。
此时,携程依旧未能恢复所有功能,但也未就确切原因作出进一步解释,除了对数据被物理删除辟谣外,对坊间传闻未作其他说明。
5月29日0:18,携程微博称:5月28日23:29,经技术人员抢修,携程官方网站及APP全面恢复正常。经过排查,携程郑重声明,数据没有丢失,预订数据也保存完整。
互联网信息安全成短板
从全线瘫痪到完全修复,携程用了将近12个小时,刷新国内互联网公司“宕机”处理时间的新纪录。
就在携程瘫痪的前一天,支付宝也出现多地账户无法登录的情况,不过仅2个小时后便排除故障。在更早,网易也曾因主干网络受到攻击,服务器出现瘫痪故障,恢复处理时间也未超过10个小时。
“一般安全事故处理也就一到两个小时,最多不超过5个小时,超过这个时间说明携程安全信息防护措施相当弱,许多互联网公司在系统设置时都会考虑到一个地区故障时将流量导向另一个地区。”多名从事互联网信息安全工作人士告诉时代周报记者。
5月29日凌晨4点,携程官方公布网站崩溃具体原因称:经携程技术排查,确认此次事件是由于员工错误操作导致。由于携程涉及的业务、应用及服务繁多,验证应用与服务之间的功能是否正常运行花了较长时间。携程官方网站及APP已于5月28日23:29全面恢复正常。
对于携程的官方声明,魏建称:“携程说的是内部操作失误,估计是一个组合原因,内部操作失误显示了漏洞,漏洞被抓住之后估计被‘黑客’设计了后门,持续删除代码,导致系统无法发布。”前述互联网信息安全从业人士表示,携程12个小时恢复网站,在互联网公司实属罕见,足以说明内部管理、系统、技术投入都存在问题,如果有灾难恢复机制,不太可能花如此长时间,“此前携程的支付系统调试接口被泄露,已足以暴露它在互联网信息安全管控这块的短板”。
去年3月22日,疑因系统漏洞,携程安全支付日志可遍历下载,导致大量用户银行卡信息泄露。
“携程说内部操作平台出现失误,每个公司都会存在类似失误,但如果是集中发布,某个流程出现问题可能影响其他业务运行。当前许多互联网公司在系统设计时,就没考虑过会全盘崩溃,整个代码丢失的问题,一旦发生,后果非常恐怖。”魏建表示道。
携程“宕机”事件,再次敲响了安全信息防护的警钟。不过,当下现实依然严峻。“很多互联网安全信息防护因投入资金量大而被忽视,很少有公司真正去做好这一块,大部分都只追求利益产出相关的技术投入。”多名业内人士感叹说。