首页 > 互联动态 > 携程出事了!到底是怎么回事?
2015
05-29

携程出事了!到底是怎么回事?

昨天(5月28日)上午11时许,携程旅行网官方网站突然陷入瘫痪,打开主页后点击时均显示“Service Unavailable”,而百度搜索上的携程官方页面也显示404错误。

目前,对于此次官网瘫痪的原因。携程官方回应称,“5月28日上午11:09,因携程部分服务器遭到不明攻击,导致官方网站及APP暂时无法正常使用,目前正在紧急恢复,对用户造成的不便,深表歉意。”

记忆中,携程这两年在安全表现上着实不佳啊。去年3月,漏洞报告平台乌云网披露了携程网安全漏洞信息,漏洞发现者称由于携程开启了用户支付服务借口的调试功能,支付过程中的调试信息可被任意黑客读取。同时被曝光的另一漏洞显示,携程某分站源代码包可直接下载(涉及数据库配置和支付接口信息)。携程后来回应称,在该消息发布后,携程旅行网立即展开技术排查并在消息发布两个小时内修复问题。

话说回来,昨天支付宝才遭遇短时间瘫痪的安全事故,今天又轮上携程。互联网大公司、主流产品如此频繁地发生安全事件,让人真心感慨:目前貌似强大的互联网产业在安全风险面前何等脆弱。#星座控顺便感慨一句:当前不愧是几年一遇的水逆期啊!

会是因为什么?数据库能恢复么?

不扯星座的淡,来说正经。现在关于携程事故众说纷纭,有说数据库被物理删除,有说携程遭遇无良内部员工报复,还有的说是不是被外部攻击……

上海易跋信息科技有限公司CEO、前盛大创新院安全卫士项目的创始人和负责人沈彤对虎嗅说:“黑客攻击可能性不大, 如果外面攻击能达到这种损害程度, 那携程的技术能力和数据安全太值得怀疑了。如果是内部员工(或者离职员工), 只能说明携程技术线管理有问题, 服务器端的安全保护不够, 同时技术力量不足。从现在的传言情况来看,最大的可能性是某人破解(持有)公司内部密码和验证条件, 放置了某些恶意程序——不是传说上传的动态也能被删除么?”

目前,携程内部有消息说,目前数据安全,数据库正在恢复中。该消息人士愤怒反驳了朋友圈里流传的一则所谓“携程数据被物理删除”的传言,称这种说法纯属捏造 ,到处散布实在太过恶劣。

不过,对数据库能否恢复的问题,沈彤认为,“不一定,要看内部备份情况, 如果像传言所说那样,破坏者是用‘01’数据覆写数据库的,那么被破坏的数据永远不会恢复了——除非有系统备份, 否则丢了的找不回来。”

沈彤说,“目前互联网业界一个倾向是技术让位给业务, 重业务模式的公司是主流, 但是一个技术人员的有意无意的‘失误’会毁掉所有业务, 这是值得警惕的。”

崩溃原因分析之「高能技术贴」

携程数据库事件网上有各种说法。有说是数据库数据和备份数据被物理删除的。也有说是各个节点的业务代码被删除 现在重新在部署。也有说是误操作,导致业务不可用。尽管众说纷芸,做为一个技术人员,我们还是需要透过现象看本质。

网站崩溃的表象

我们先观察一下ctrip这次问题的表现。从我观察视角来看,在下午2点左右,携程PC版的首页上的酒店、机票这两个最核心的应用还是无法使用的,而且个人用户也是无法登录的,同时携程手机端的酒店、机票无法使用,以及个人订单是无法查询的。

而网上的新闻报道上午11点服务就不可用了:携程方面称,今天上午11时09分,携程的部分服务器遭到不明攻击,导致官方网站及APP暂时无法正常使用,目前正在紧急恢复。从携程内部人士处获悉,此次不明攻击是携程未拦截成功的第一次数据库攻击,目前技术部正在抢救。

数据库整体被攻击的可能性极大

从这些信息来判断,应该不是业务流程上线中出BUG,或者上线流程过程有些误操作。为什么这么讲,我们要进行粗略分析。对于用户的角度来讲,好像携程的首页是只有一个,好像携程只有首页这么一个,各个业务的入口是统一的,但是从程序以及项目管理的角度来看,单单只是从携程的首页来看,至少有14以上个业务部门以及项目,而且这些项目之间关联耦合度不大,平时上线肯定也是独立上线的,如果一个项目挂了,短暂不可用又很快恢复了,那还可以理解,毕竟谁上线没有回滚过。但是大面积绝大部分业务都不可用,必然不是正常的上线流程中出问题。基本上我们可以判断,携程内部系统肯定是受到大规模的攻击,大部分的业务节点受到严重的攻击或者数据库受到严重的攻击,至于是内部员工或者是黑客那就不好说了。

我们再来分析下是不是业务节点受攻击,从表象来看,业务节点或者负载均衡应该是被攻击了,不然不会点击酒店和机票搜索都会跳出Http/1.1 Service Unavailable,而应该会出现搜索迟迟不出结果,但是网页大部分的界面还是可以展现的。如果仅仅是业务节点受攻击,比如:所有的业务节点上的部署的代码、程序被删除了,或者是关机了,受到这种攻击恢复的手法还是可以非常迅猛的,毕竟机器还在,携程做为一个十几年的老牌公司,上线部署流程应该是建设的比较完善的,可以在比较短的时间内进行恢复。

我们再看是不是某个数据库挂了,从前面我们也讲到,携程的业务多,项目多,这些项目与业务线是不太可能使用同一台数据库的物理机的,携程的数据库机器数量肯定是比较庞大的,而且我相信携程的数据库肯定是做好高可用的,同时日常备份是定期进行的。如果只是个别数据库挂了,恢复起来的时间是非常快的。但是从这次攻击的事件来看,数据库整体被攻击的可能性非常大。

可能摊上大事了

如果这是一次黑客攻击,那黑客对携程内部的系统了解程度那是相当的深,而且渗透、潜伏的时间非常长。如果这是一次非常恶意的攻击,而且黑客对携程苦大仇深,想一击致命的话,数据库就会是核心攻击目标。业务节点丢点程序代码不会紧,最多就像人走在大街上衣服被抢光了而已,虽然丢人,但是还是可以很快再搞几件衣服回来穿上就是了,要是数据库被删除,而且不仅仅是逻辑删除,而且是物理删除,同时把所有备份也进行非常彻底的物理删除的话,那基本上心脏中枪,没得救了,不过好在这种情况出现的可能性不大。如果黑客把数据库所在的主、从机器上的数据全部进行逻辑删除,同时运行类似于dd的命令进行数据覆盖,那么主、从机器上的数据是没法救的。

从网上的新闻来看,上午11点09服务就不可用了,我们做一个最坏情况的猜测:黑客应该是攻击了大部分的数据,同时估计也备份到存储上的数据也给删除了。所以到现在,携程的服务还没有恢复。

那么现在的问题关键点来了:携程是用什么方式进行数据库的备份的(如果没有日常备份,那整个携程就可悲剧了)。如果采用内部私有云存储的方式进行备份,那么此事还有的救。虽然黑客有可能把这些数据从云存储的应用端删除,但是服务端这些数据可能还存在。数据是否可以恢复要取决于私有云存储的架构。携程从公开的报道来看,内部私有云用的是openstack,那么很有可能是使用swift的存储,除非黑客也是非常熟悉swift的架构,把swift上的三个备份的机器找到,进行物理删除。否则,数据还是有可能恢复的。如果到备份到存储一体机,我相信数据还是有可能找的回来的。简而言之:如果有正常的备份,我相信数据还是可以恢复,如果没有做数据库日志的实时备份的话,最多丢个一备份周期的数据(一般是一天)。

上面讲的都是针对性的攻击,但是最坏的情况是:黑客掌握了携程大部分机器的root权限,同时进行无差别的毁灭性的攻击的话(业务节点、数据库节点、存储节点),那后果反正我是不敢想了。

盘点下最近半年拥有亿级用户的互联网产品的安全事故与漏洞

姿势1:一剪没

5月27日,部分网友称支付宝故障,账号无法登陆或支付。支付宝方回应称该故障是由于杭州市萧山区某地光纤被挖断导致。随后支付宝方将用户请求切换至其他机房,受影响的用户逐步恢复。支付宝故障引起的轩然大波也引来网友关注。不知不觉中支付宝已经成为不少网友生活中不可或缺的一部分,甚至与同事出去吃饭,都是一个人掏钱,其他人支付宝转账。而2011年,马云称支付宝瘫痪我进监狱的旧闻也被网友挖出来。在互联网时代,我们的生活与这些网络公司息息相关

不知道挖断支付宝的公司怎么处理的,反正去年挖断国防光缆造成军演暂停的司机大哥被判了16年。

姿势2: 被殴死

最近还遭遇了瘫痪悲剧的还有陌陌,5月10日晚间@陌陌科技 在微博上宣布“由于网络故障,陌陌暂时无法正常使用”,引发无数宅男吐槽。当神器遇上网瘫,想说爱你不容易。次日,5月11日晚9点多,网易也宣布其骨干网络受到了攻击,导致其移动应用、游戏无法访问、刷新。

“我跟你什么仇,什么怨?谁干的放学不要走,操场见!”

姿势3: 被挤死

2015年2月6日,铁路订票网站崩溃,从上午10点起显示“页面无法打开”,瘫痪持续1小时,乘客无法订票。官方表示瘫痪原因是因为访问骤增,Alexa排名由3个月前的1059位跃居115位,服务器有点受不了。

在各大公司都为流量苦苦发愁的时候,铁老大的伤心处真是让人羡慕嫉妒啊。

姿势4: 躲猫猫

2015年1月19日中午微信出现短暂瘫痪,用户无法收发信息、无法刷新朋友圈、无法登录微信公众平台等问题。许多网友误以为是自己的手机出问题,多次重启手机,甚至还有网友多次卸载重装微信、重启无线路由器。具体原因,有消息称是宕机导致,但是微信方没有回应。

微信PS:“啦啦啦~就不告诉你,我就不告诉你,有本事你别用啊!”

为了更好的为人民服务,大佬们要加把劲为人民服务啊!现在行情这么好,股市里分分钟几百万上下,你们赔得起吗!



最后编辑:
作者:vicken
这个作者貌似有点懒,什么都没有留下。

留下一个回复

你的email不会被公开。