3月24日SAE故障后感想

SAE出口点众多,以往即便某条线故障,我博客依然可以从其他地方访问,可万事无绝对。3月24日SAE核心区那次电力故障,致使SAE整个数据中心瞬间宕机。当时正值深夜,我是没什么感觉,也是官方出面后我才知道怎么回事。细读一番说明,我了解即便SAE号称分布式计算,它目前也是依赖单独一个核心机房,尽管这重点机房多重防护做得很好。也还是将鸡蛋放在了一个篮子里。先不说机房遭遇恐怖袭击,导弹轰炸这样极端的事,一次市电线路故障居然都能殃及无辜……

因为SAE是实施计费的,此故障时间比较长,影响较大。官方给予了云豆日平均消耗的30倍,大约一个月的补偿,解释道歉后,SAE表示在今年下半年在南方增设备用节点。大约意思是今后即便北方机房坏掉,也有南方机房热备,随时可以顶上的意思。

可能大家很奇怪,一般机房都有双线供电,并有UPS不间断电源保证平稳切换的,怎么还犯电源故障这种低级错误呢?以下是官方说明的原文:

2014年3月24日22:53分,SAE的核心数据中心突然发生电力故障,导致该中心内所有设备宕机。故障出现时正值深夜,SAE团队立即进行紧急处理,并于25日2点开始逐步恢复服务,虽然我们尽了最大努力,但还是对用户的应用造成了很大影响,在此,SAE团队对各位用户致以最诚挚的歉意,为了尽量弥补给广大用户造成的损失,SAE将补偿各位用户30倍故障时间的云豆消耗额,企业用户服务也将按照故障时间的30倍进行延长。此次云豆补偿将以云豆卡的形式发送,用户可以根据自己的需求选择账号进行充值。

关于此次故障几点说明:

1.故障的原因到底是什么?

此次故障原因是因为运营商机房,在未事先通知我方准备的情况下,发生整体电力故障,以下源引运营商故障说明,“2014年3月24日22:53分,在进行市电与油机供电切换过程中,发现UPS设备输出供电闪断。厂家根据告警的历史记录,进行了综合分析,判断原因为该UPS系统在市电供电与油机供电切换的瞬间,市电交流电的相位及频率发生波动,使油机发出的交流电相位,频率与市电相位,频率不同步,无法进行跟踪,导致该UPS系统瞬间切断负载供电,进入到优先保护UPS主机状态”,应该承认类似此类影响整个核心机房供电的故障极其罕见,但也确实发生了,并给SAE上大部分用户带来致命影响,SAE作为云计算服务商,对下游资源负责,不推卸责任,说明原因只是让用户了解到具体细节。

2.我的数据会不会丢失?

目前数据已经基本恢复,不会出现数据丢失的情况,如果您的数据恢复遇到问题可以联系我们(普通用户可以通过官方论坛和意见反馈,企业用户可以直接电话联系客户经理),我们会尽快帮您解决。

3.我的补偿如何计算?

我们会根据您应用上周的云豆消耗,计算一个云豆日消耗的平均值,然后乘以30,此次补偿将以云豆卡的方式发送(不绑定账户),您可以根据自己的需求选择账户进行充值。

补偿云豆数量=应用上周日均云豆消耗*30。

同时,我们将会延长企业用户30天的账户等级提升服务。

云豆卡将于本周内陆续发放,届时请登录SAE查看系统通知。

4.为什么故障恢复需要的时间很长?

在本次故障发生之前,SAE每周定期进行服务器重启预案演练,力求在服务器异常重启后不能影响应用的正常访问。但本次故障是核心机房电源故障,相信大家都经历过传统windows PC突然断电重启后缓慢的磁盘修复同步过程,服务器也不例外,大批服务器在业务繁忙运行时同时断电不仅会波及SAE其他机房,而且会导致大量数据异常,包括内核panic、挂载点丢失、库表损坏、文件块损坏、日志损坏等,这些很多都需要人工介入逐个修复,所以恢复时间会比正常机器重启长很多。

5.这样的事情还会不会发生,SAE是如何进行机房容灾的?

此次发生电源故障的是SAE核心机房,该机房是目前国内主流运营商的骨干机房,诸如UPS、双路电源都是我们当初选择该机房的必备考核指标,但即使如此,故障仍然发生,SAE将加强和运营商沟通避免此类情况再次发生。故障发生后,SAE第一时间和机房交涉,工程师连夜赶赴机房,全体工程师通宵努力,为了就是让大家的应用早日恢复。虽然自2009年SAE正式上线至今,这是第一次发生此类极端故障,但SAE仍将深刻吸取本次故障的教训,加强机房管理,并在今年下半年在南方增设备用节点。

SAE比任何人都不希望故障的发生,因为只有稳定才是云计算服务的核心价值,才是用户使用、信任SAE的唯一理由!故障发生后,瞬时间天南地北的电话和反馈,让SAE的所有人感觉到我们的责任是多么之重,稳定对用户是多么珍贵,这些反馈有谩骂、嘲讽也有鼓励和理解,对于前两者,我们欣然接受,你们的批评是我们前进的动力,对于后两者,我们表示感激,我们坚信PaaS云计算模式的快速部署、免运维是未来云计算发展的必然趋势!本次故障也暴露了SAE自身的一些问题,特别是对于核心机房全体断电的突发情况应对不足,SAE也愿意在全体用户的监督下,用实际行动进行改进!

最后,再次向您表示最真诚的歉意,今后SAE团队将会尽最大的努力,保证平台的稳定运行,希望大家继续支持SAE!

其他相关文章
  • 暂无相关文章
  • 觉得好可以点个赞!
    (暂无人赞)
    Loading...

    论“霸王条款”之手机流量清零

    3▪15之后,总能听到关于消协那边的好消息。首先网购七天无理由退换政策得到普行,其次规定了发布虚假广告的媒体要承担连带责任。还有最近消协官员闹腾,说那手机流量月底清零不合理,服务协议里“霸王条款”应无效。

    清零流量包是剥削?

    这观点刚出来的时挺新鲜,话说流量清零政策从我会用手机上网开始就有,月月如此,年年如此,以至于民众早已习惯,感觉这很正常呀。去年不知哪人突然灵醒,发觉自己每月买的流量包用不完就被清零,很不公平,开始叫嚷这乃赤裸裸的剥削!

    此观点一出,不少人醍醐灌顶后瞬间叫好。消协开始代表民众并拉上一些想出名的律师跟运营商打一些引人瞩目的官司。虽是屡战屡败,仍旧越挫越勇!在他们眼中,胜负已不重要,关键是要激起百姓维权意识!即便那个所谓的“权”有待争议!

    问题的本质

    我觉得这讨论很是有意义,可大伙似乎弄错了问题焦点,剥削不是问题核心,核心是流量的贵与贱。那消协也真是的,觉得手机流量贵就直说嘛,何必拐弯抹角扯这清不清零的蛋呢?难怪运营商一点感觉都没有。

    一般流量都是包含在套餐内,选了这套餐就本该遵守那游戏规则。消协说那是没得选的“霸王条款”,这明显与事实不符。还是近些年运营商简化了套餐,若在以前,那五花八门的各色套餐多到让人眼花缭乱。怎么能说没得选?退一步,不想被清零的话就不要选套餐包嘛,流量实时计费1元/M,土豪才不嫌贵。

    扯蛋的分析

    一番分析下来,就有人觉得真扯蛋了,更蛋疼的还在后头,流量月底清零的政策对多数人没影响,比如我,每个月300M流量都用不完,就算无限累计也没啥意义。而月光族们更不用说了。流量清零政策只影响一种人,就是本月1M都不用,下个月突然猛搞几个G的。运营商讨厌这样的用户,因为他们行为不可预测,好比某人突然发飙,你肯定不会给他好脸色。

    用户有发飙的权利吗?当然有,只要你给够多的钱,人家可以弄个信号基站专供你用,爱怎么飙怎么飙。那是有钱人的权利,一般人玩不起,所以团购、拼车之类都是凑着人多,利用规模效应降低人均成本。本质就是要你顺着大众集体一块消费。别人每月用这么多,那你也要跟着每月消费这么多,用多用少都是吃亏。

    流量包背后的潜规则

    说到最后,有人觉得不对,每月买的流量包被清零明明就是侵权。一分析下来居然还合情合理,这什么狗屁理论。砖家叫兽都一窝黑,是呀,人家不好意思跟你直接说真相:月流量包不完全属于你,若能顺着民意使用,低价量多自然爽快,若忽高忽低逆天而行,结果自然就是不客气的权利剥夺。若还有不服,那尽管详阅服务条款,我相信运营商的格式合同里肯定清清楚楚写了这些,尽管字可能会如蚂蚁般小,可签过名就表示知悉认同,不要说没得选,至少你双脚还可以投票。

    流量经营的创新设想

    说双脚投票没意思嘛,一点建设性都没有,咱们好歹是讨论协商,总得有个解决方向吧。虽说不是什么事都能有答案,但这事并非无解,以山哥的建议,大陆运营商应当学学香港,那只有弹丸大点的地方,论思想、经济、文化、创新等都是走在世界前列,人家中国移动到香港,被那边N多家运营商虐之后都变聪明了,学会让民众一块参加这流量套餐的游戏,流量用不完是吧,你可以折价转给卖朋友呀。

    适合国内的玩法创新

    话说,如果这流量游戏如果能放在大陆玩那就大有意思,先不说咱地广人多层次复杂,以咱大陆人之精明,玩法将更多样,搞不好会专门有人批发流量转个三手四手,只要运营商能源头把好关,这都不算个事。如果运营商够聪明的话,专门开发个客户端做交换平台及交流市场,几个广告轰炸一下,人气马上有。

    二手需求一直都有,更别说手机流量这种看不见摸不着的热门货。聪明的可以安排水军,假装临近结算日,用不完流量的小百姓,想折价吐血换回钱,搞个1G只卖10元。更狠的可以在接近凌晨的时候玩1元/G。只要大伙意识到这上面的流量永远比营业厅便宜,偶尔还能淘到大宝,官方平台还不用担心假货,这等神器恐怕人人都想试一下。

    流量改革的路有多远?

    想法固然是很美好的,只是现实上,因历史原因运营商都是分地而治,各地政策千差万别。你觉得10元/G很便宜,但在某个地区人看这都贵的要死,若流量能当二手货一样自由交易,势必有人利用不同地区差价,将流量低买高卖赚差价。老话说这就是投机倒把。即便这么严峻的现实摆在面前,山哥依然敢于设想,是因为放眼未来,山哥看到了全网统一计费的大趋势,不管是移动4G还是联通3G,只要在中国,走到哪都是一样的。运营商自己也喊着转变方向,经营流量,既然都稳坐流量之源,那何惧之有?

    觉得好可以点个赞!
    (暂无人赞)
    Loading...