数据中心管理十六宗罪

日期: 2010-08-29 来源:TechTarget中国 英文

    在数据中心的正常运行中,一个微小的错误就可能导致灾难性的后果。不仅会对客户造成经济损失,对自身的商业形象和发展也会产生不良的影响。所以作为数据中心的管理人员一定要保持良好的心态,以避免错误的发生。如果错误发生了,就从这些错误中吸取教训,来防止以后再次发生这些错误。
  
  以下是16个常见的数据中心管理存在的误区,这些误区因为各种各样的原因会存在于数据中心的日常管理和运行维护中,可能人们还没有重视它们。所以数据中心的管理人员应该重视它们并做好安全防范的工作。
  
  16个最常见的数据中心管理误区
  
  这些误区是没有先后顺序的,而且可能它也不是很详尽的,但是它会提醒数据中心的管理人员,做好安全防范的工作。万一错误出现了,后悔是来不及的。
  
  错误1:没有一个良好的电力使用规划忘记了电力成本的巨额支出
  
  数据中心的电力费用是整个数据中心日常开销中最大的一部分,如果没有一个良好的电力使用规划,那么数据中心的财政支出就被浪费了不少。对于数据中心创造的业务价值来讲,保持低成本的运行才是企业所乐意看到的。
  
  错误2:没有设计模块化
  
  如果你拥有一个现在最先进的数据中心,但是却没有部署模块化的环节,那么用不了几年,这个数据中心就会被更先进的技术淘汰。所以为了适应数据中心将来的发展,必须要部署模块化。
  
  错误3:没有利用数据中心的设计和设施的优势,来帮助数据中心降低成本并更有效地运行。
  
  有些数据中心不会利用自身的优势来降低成本并提高效率,例如,在冬天的时候可以利用室外的低温改善制冷技术,来达到节省冷却成本的效果。
  
  错误4:认为只有一个方法来设计或维护一个数据中心
  
  标准化的管理方案并非是最好的,最具成本效益的解决方案。虽然数据中心通常是相似的,但使用一个能够适合企业理念和需要的管理方案才能使该数据中心发挥出最大的作用。所以,每个数据中心都应该的定制一个属于自己的管理方案。
  
  错误5:工作人员的任用不当
  
  数据中心必须要保证每个工作人员都能适合并胜任他们的工作,而且必须明确每个人所扮演的角色和应该承担的责任,并保证整个工作团队的协作。
  
  错误6:工作人员没有得到适当的培训和指导
  
  如果数据中心的工作人员不能够得到一些培训和指导的情况下,他们在面临一些问题的时候会很难做出迅速的反应。同时也可能不可避免的犯一些错误。所以,对员工做一些专业的培训和指导对于处理一些突发事件是一件很有必要的事情。
  
  错误7:没有关键环境工作许可
  
  每个数据中心都必须对它的员工说明,哪些工作是具有危险性的。并且在进行那些具有危险性的操作时,为了为了防止以外的发生,工作人员必须要通过一个关键环境工作许可(CEWA)的认证。CEWA有不同的等级,对应不同的风险水平,在高危险的水平下工作甚至需要行政授权。。每个外勤工作人员都应该详细地了解这些,来避免危险的发生。
  
  错误8:没有提醒数据中心的客户会存在一些不可预见的状况
  
  在跟客户的沟通上,一定要提醒客户可能会存在一些不可预见的状况,如自然灾害,停电等等。这样可以使客户能够做好更充分的准备,并保证他们的业务不会因为这些突发状况而受到影响。
  
  错误9:没有考虑气候的因素
  
  不管什么时候,数据中心的管理者都应该注意气候的变化,并做出相应的举措。例如,在夏季高温的条件下,数据中心必须加强制冷系统的监管,必要的情况下必须要扩大制冷系统来防止因为数据中心宕机而引起更大的损失。而在低温的冬季,有些地区晚上甚至可以关闭精密空调冷却系统而让数据中心进入自由冷却状态。
  
  错误10:数据中心和企业在发展目标上缺乏协调和沟通
  
  数据中心的建设本身是为企业服务的,所以数据中心必须要和企业在长远规划上相一致。例如,引入绿色IT的战略,建立绿色数据中心不单单是为了数据中心本身的考虑,更多的是考虑企业的社会形象。

  错误11:一些关键性的重要设施上没有标志
  
  虽然这是一件小事,欧洲专利局的数据中心曾经发生一起事故,其关键性的电力设施上没有标志导致一位清洁工以外关闭了电源,结果使整个数据中心失去电力供应。
  
  错误12:没有对数据中心进行升级和维护
  
  如果数据中心缺少必要的升级和维护,不但工作效率上会降低,有时候也会因为设备陈旧而导致一些问题的产生,例如短路造成的停电。
  
  错误13:没有认识到网络延迟和应用延迟的不一致性
  
  如果服务器的延迟增加了50毫秒,并不是意味着应用程序的延迟也是增加了50毫秒。很多数据中心的管理人员并没有意识到这一点。
  
  错误14:忽视了一些安全问题
  
  有些安全问题经常被忽视,例如接地,静电等等,不要把任何事情都视为理所当然。不要因为有了UPS,就忽视了防雷电路的监测。所有的安全问题都必须要得到重视,不重视的后果往往是灾难性的。
  
  错误15:过度依赖于环境监测程序
  
  不能只依赖于显示器,如果事情不对劲,靠人来确定显得更为可靠。如果UPS发出了一个奇怪的声音,监视器上是什么也看不到的,但这个问题很可能会导致一个致命的错误。所以,数据中心的管理工作必须要一丝不苟,一点都不能疏忽。
  
  错误16:认为所有的网络连接是平等的
  
  并不是所有的服务提供商提供的网络都是一样的。所以数据中心的管理者必须要确保他们的网络服务提供商提供给他们的网络是高效的,可以确保用户获得他们想要取得的数据和信息。
  
  如何避免这16个最常见的数据中心管理的误区
  
  现在技术已经发展到了这个地步,连汽车都有了自动导航防撞系统。那么,数据中心为什么不能避免错误的发生呢。其实许多很小的问题都是可以避免的,但就是因为这些小的问题,导致了数据中心的宕机,停电,甚至企业的瘫痪。
  
  有一些数据中心曾经发生过一些错误,导致了一些事故的发生。所以,每一个数据中心的管理人员很有必要去吸取这些经验教训,来找出自己的不足,并加以改善。对于这些,有以下五个步骤,可以帮助数据中心的管理人员来更好的避免这些事故。
  
  第1步:敢于承认自己的错误
  
  用于承认自己的错误,并不意味着失败。相反,它意味着对错误深刻的认识,以及改正这些错误的决心。所以,对于数据中心的管理人员来讲,承认错误对于更好的管理数据中心是很有帮助的。
  
  第2步:进行“灾难演习”
  
  因为数据中心的事情一般不会发生,所以在安全的情况下,应该进行突发事故的演习。只有经历的这些,工作人员才能够突发事故出现的时候做出迅速的反应,来避免不必要的损失。
  
  第3步:做出详细的解决方案
  
  这个解决方案包括使用的设备,解决的过程说明以及那些可能会发生故障的设施。这个解决方案可以作为工作人员的参考指南,并为每个新员工提供指导。
  
  第4步:听取第三方顾问的意见
  
  在建设一个新的数据中心的时候,一定要仔细听取第三方顾问的意见。这样做,可以最大程度上了解潜在的问题。在建设的时候,可以通过第三方顾问了解到比承包商更多的设备来源并选取适当的设备。在数据中心建成的时候,还可以通过第三方顾问来测试数据中心的安全性,并制定一个相应的使用计划。
  
  第5步:勇敢的去改变。
  
  虽然做出一些改变往往涉及到一些费用和时间,当如果发生了事故,损失往往会更大。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

相关推荐

  • 企业是否应该考虑系统管理服务?

    我们都知道,系统管理服务为企业提供了一整套关键服务,这对企业有着很大吸引力,但企业必须确保选择具有良好客户服务 […]

  • DCIM工具在现代数据中心行业中的地位如何?

    随着数据中心变得越来越复杂,管理员应该转向使用DCIM工具来更好地管理灾难预防,容量规划以及资产和能源管理。

  • 企业需要DCIM工具来做什么?

    数据中心基础设施管理工具帮助管理员更深入地了解其IT基础架构和设施的性能。随着DCIM工具的逐步成长以及市场的不断发展,它们能提供更先进的功能,可以更深入地探究数据中心业务核心。

  • 因地制宜:为企业数据中心添加自动化

    如今,自动化是很多数据中心的建设重点,这个术语已与云计算融合。人们都在宣扬自动化,在某些情况下,IT人员甚至不确定什么是自动化或为什么需要自动化……