本文是数据中心EPO使用指南系列的第一篇文章,第二篇文章请看紧急断电的局限:如何防止EPO造成宕机? 数据中心里最危险的东西是什么?是人类自己。如果每个出口旁边都有一个EPO(emergency power off,紧急断电),那任何可能出错的工作人员都是定时炸弹。据报道,数据中心宕机的罪魁祸首大多数是人为错误,其中EPO最容易引发宕机,所以值得管理员思考。作为一个出口上的按钮,它的出现实在是个错误,很容易被心情差的雇员不小心就碰到。
如果粗心和无知的电工破坏EPO的线路,也会导致宕机。有的EPO线路竟然被无意间随意布置,结果很快就不能用了,同样宕机会发生。很多EPO一开始装配就偏离了要求的……
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
本文是数据中心EPO使用指南系列的第一篇文章,第二篇文章请看紧急断电的局限:如何防止EPO造成宕机?
数据中心里最危险的东西是什么?是人类自己。如果每个出口旁边都有一个EPO
(emergency power off,紧急断电),那任何可能出错的工作人员都是定时炸弹。据报道,数据中心宕机的罪魁祸首大多数是人为错误,其中EPO最容易引发宕机,所以值得管理员思考。作为一个出口上的按钮,它的出现实在是个错误,很容易被心情差的雇员不小心就碰到。如果粗心和无知的电工破坏EPO的线路,也会导致宕机。有的EPO线路竟然被无意间随意布置,结果很快就不能用了,同样宕机会发生。很多EPO一开始装配就偏离了要求的准则。所以本技巧将为你讲述装配EPO开关时的必要准则,还会告诉你,在什么时候使用不当,会把EPO变成数据中心的引爆开关。
大型机电源和EPO的一段孽缘
如果EPO开关会给数据中心带来潜在危机,为什么我们还需要它?这与历史有关,而且这个历史已经转变成法律上的规定,但是现在,规定通常会被误用。
EPO的诞生源于大型机,因为它们使用大量电能,花费昂贵,可能会导致“死机损坏”而不是烧坏。所以电工安装了一个大的红色紧急关闭按钮,这样管理员就可以在必要的时候立刻按下,关闭整个房间的电源。现在的EPO做的也是这些事情。它能够立刻关掉数据中心所有的设备,不管是IT关键设备还是空调,不管是UPS还是电池。结果就导致计算机严重损坏。
而且也没有旁路(料想也不会有),只有一个小小的例外:就是对于关键计算设备,可能会允许有一个逐步有序的关闭过程。如果确实需要EPO(实际上需要的时候也不多),在出口旁边装上也是很容易的——只要你要求过,或者有关部门采取了2011年的标准(其准则提供了可供选择的方法,在本文稍后会提及),但是决定什么时候实行新准则的是当地委员会,对于大多数委员会来说,几年内是不会采纳最新的准则的。
美国国家电气规范和EPO的前世今生
装配EPO开关是美国国家电气规范(National Electrical Code,NEC)中645条款中要求的,该条款在1968年首次出现。条款的标题名为Information technology equipment,即信息技术设备,标题在数年间改变过好几次,以确认类似电话系统这样的设备,与传统数据处理设备一起安装在了机房。
现在的标题,和以前的标题例如“Data processing systems(数据处理系统)”、“Computer/data processing equipment(计算/数据处理设备)”,会让人觉得645条款中的标准约束了任何地方的计算机。事实上正好相反!美国国家电气规范的第六章(即645所在的章节)提到,适度修改大体的规则是允许的,这在第一章到第四章也有提及。这些大体的规则覆盖了专门的空间、特定的设备型号或者例外的情况。所以645条款是比较“宽容”的,它允许了你做出与平时规定要求相反的事,但是只有在你打算遵循其他规定时才能这样。其它的规定中,有一条要求在每个主要的出口安装一个“approved disconnecting means(允许的断开方法)”,也就是EPO,这个术语没有被NEC正式承认和使用。如果你不想这么做,不安装EPO开关是你的自由。
事实上,类似data center(数据中心)和computer room(机房)这样的术语也没被NEC承认。这不是说你非得遵从645条款的要求,管每个有IT设备的房间叫“信息技术设备房间”。你只有在这两种情况下才要遵守:
- 如果你在活动地板下运行通风、电源或者布线。如果没有活动地板,或者不用于制冷,那从一开始645条款就不适用。这是为什么很多人鼓吹淘汰活动地板。以后我们会更深入探讨这一问题。
- 如果你想从违反645条款一到四章的规则中获得好处。
违背条款包括以下情形:
- 灵活的电源移动(插座没有在地板下关死)。
- 在静压箱地板开洞,使用非高压通讯电缆。
- 使用多种小UPS元件(小于等于750 VA)使得关键设备有序关闭,避免死机受损。
- 特定接地选择。
翻译
相关推荐
-
圣诞节亚马逊数据中心发生宕机事件
圣诞节平安夜,亚马逊AWS位于美国东部的数据中心发生故障,其弹性负载均衡服务中断,导致Netflix和Heroku受到影响。
-
杯具大盘点:2012下半年数据中心十大宕机事件
2012年下半年宕机事件也不少,最为典型的例子是云中断,下面又到了盘点这些层出不穷的“杯具”时间。
-
2012年云计算数据中心的九个杯具
尽管投入各种高新复杂技术,尽管投入海量巨资,云计算还是显得有些脆弱,在过去的几年里不乏动辄就宕机数小时的事件,甚至有的长达一天或数天,并导致数据丢失。
-
数据中心高可用性:“五个九”意义有多大?
高可用性对于IT生命来说很关键,但是对于很多企业来说,所谓的“五个九”,也就是99.999%的情况下正常运行时间不是必要的。