亚马逊云计算数据中心六月二度停机

日期: 2012-07-15 作者:BPariseau翻译:王启 来源:TechTarget中国 英文

亚马逊位于弗吉尼亚地区的数据中心六月末发生了一起断电事件,影响到了其Web服务,包括Pinterest、Netflix还有Instagram,官方在表示这次事故主要是因为发电机故障。

  这是本地区六月发生的第二起因为发电机引起的事故。

  North American Access Technologies的CTO Julius Neudorfer认为即使大部分情况是因为发电机,但是问题在不同数据中心具体不同。但是这些故障都意味着后备系统没有在故障模式中测试。

  “显然他们没有从每个问题中寻找教训,似乎他们通常只是测试运行的设备,而没有注意测试的时候关注故障那一方面。”

  亚马逊的AWS Service Event报告申明在6月29的电力风暴中,亚马逊东区十个数据中心中的两个被迫转移发电机电力。

  其中一个数据中心故障转移没有成功,因为“每个发电机都发生了各自的故障,导致无法提供稳定电压。结果发电机不能承担负载(报告中的描述)”。因此服务器开始运行UPS。

  亚马逊在稳定初级和后备的发电机,ups系统耗尽,服务器在晚上8:04开始失去电力。十分钟后后备发电机稳定了,UPS也重起了,这时能源又开始存储下来。整个设备在8:24电力回到正轨。

  但是断电还没结束,EC2灾难恢复步骤中的瓶颈和Elastic Load Balancer控制仪表的故障使得部分受影响的客户无法上线,直到11:15至12点。

  本月14日的故障首要原因是线缆问题,但是某个后备发电机的风扇也坏了。而这次故障中,第二个后备电源也坏了。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

翻译

王启
王启

相关推荐