拒绝数据中心的隐形杀手——人为失误

日期: 2010-09-13 来源:TechTarget中国 英文

  根据研究表明,由于人为原因所造成的数据中心上的损失是不可避免的。由于人不会像机器一样精确无误,随着工作时间和工作压力的增加,不可避免的就会出现一些错误或者疏忽,从而引起数据中心的一系列问题。
  
  不过,如果我们能够在设计以及预防上采取一些措施,这些人为的错误是可以越来越少的。
  
  限制访问人数
  
  限制进入数据中心的人数,是减少认为错误一个不错的开始。在几乎所有的企业中,只有一小部分的工作人员需要一直呆在机房里。而其他人应该限制进入。虽然。很少有人进入数据中心后会故意产生恶意的行为,让除了工作人员之外,限制其他人的进入是一个不错的管理方法。他们可以凭借钥匙卡或者是密码在需要进入数据中心的时候进入。
  
  绝大多数的人为错误并不是有意的行为,可能只是人们在不经意的时候碰了一个按钮,或者将不小心将线路缠在了一起,而这些不经意的动作往往会产生灾难性的后果。
  
  将那些数据中心里的重要设备锁起来也是一个不错的方法。只有重要的工作人员的需要的时候才能访问它们,这也直接避免了这些设备上可能会产生的人为错误。
  
  非IT人员的培训
  
  另一方面,由于工作的需要,会有很多非IT的人员进入到数据中心里。例如,定期保洁人员,电工以及其他工作人员。
  
  这些人进入数据中心就必须要取得该环境下工作的许可。仅仅靠符号的警示是不够的,必须要对这些非IT人员进行专门的培训,让他们知道什么可以碰什么不能碰。
  
  另一方面,大多数数据中心将仍然被访问的非IT人员-定期保洁工作人员和其他场合的电工和技术人员。这些工人必须听取他们对环境的即将进入。如果这些非IT人员没有得到应该的培训。可能会发生以下的情况。保洁人员可能会因为吸尘器找不到插座而将UPS的插头拔掉。如果这个时候数据中心发生断电,那么这个后果无疑是灾难性的。
  
  对于电工等技术人员来讲,不仅仅要让他们知道什么不能碰,还应该让他们知道如何更好的保护设备。这样他们才能在施工的时候,对设备的影响达到最小。
  
  设计与环境
  
  就像家庭设计中针对儿童安全的环节可以有效的减少孩子们发生意外一样,数据中心的布局和设计也是影响人为错误产生的重要因素之一。
  
  例如在数据中心设计设置温度和湿度的自动监控是一个能够有效减少人为错误的方法。这样大大减少了工作人员在数据中心内需要亲自操作的次数,也就减少了发生人为错误的几率。
  
  另外,任何按钮,例如紧急断电,一旦不小心将它启动了。应该有一个可以中断这个进程的设置,而不应该是不可中断的。这也为一不小心发生的人为错位提供了补救的机会。
  
  尽管很多工作都可以通过远程进行直观的操作,但有时候进入机房内仍然是不可避免的。所以,当工作人员进入服务器机房的时候,贴上标签是减少人为失误一个行之有效的方法。
  
  另外,物理上的防护有时候也十分的重要。例如,保险杠,保护栏杆等设施可以有效的保护设备收到不小心的撞击,以保证正确的运行。
  
  注重每一个细节
  
  有个很奇怪的现象,日常的操作往往是最容易产生人为错误的时候,而人们产生这些错误的时候往往是任务快要完成的时候。因为往往是这个时候,人们往往会产生疏忽的心里,只想快点完成任务而忽略了一些应该注意的细节。
  
  而日常操作的每一个细节都是很重要的。例如,忘记一个驱动器的备份或者错误的磁盘交换都会导致很严重的后果。虽然,这些行为往往都是日常任务的最后一步。
  
  所以在进行日常操作的任何一步都不能疏忽,每一个细节都可能会对结果产生很大的影响。
  
  减轻工作人员的压力
  
  当工作人员的压力过大时,也是人为错误发生最为频繁的时候。在巨大的工作压力下,工作人员很可能会忘记一些应该注意的事项,从而产生一些不必要的疏忽。
  
  而在数据中心的内部,往往会有一些很严厉的惩罚制度,是针对那些人为错误的。而这恰恰会给工作人员带来巨大的压力。如果长期在这样巨大的压力下工作的话,往往会起到反作用。
  
  所以,在数据中心内,制定严厉的措施并非会起到良好的效果。而适当的给那些工作在这个环境下的工作人员减压是一件很有必要的事情。只有这些工作人员在舒适的环境下工作,才能保证数据中心的正常运行。
  
  吸取以前的教训
  
  很少有企业在公共场合宣布,它们的数据中心曾经发生什么样的重大事故。往往是造成了一些严重的后果才会不得不出来解释。可能是为了维护企业的形象和保持那些潜在的客户。而同这一现象形成鲜明对比的是航空业,航空业每次事故后都会努力调查事故的原因,以保证他们以后再也不会出类似的问题。
  
  但是,即使企业不去公布自己的数据中心事故,但是公众的力量是可怕的。等到公众发现这些事情的时候,事故造成的影响力要比企业自己去公布大的多。
  
  有句谚语说的很好,那些不承认错误的人注定要重复它。所以,只有更好的认识到以前发生的错误,才能更好的避免错误的发生。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

相关推荐

  • 企业是否应该考虑系统管理服务?

    我们都知道,系统管理服务为企业提供了一整套关键服务,这对企业有着很大吸引力,但企业必须确保选择具有良好客户服务 […]

  • DCIM工具在现代数据中心行业中的地位如何?

    随着数据中心变得越来越复杂,管理员应该转向使用DCIM工具来更好地管理灾难预防,容量规划以及资产和能源管理。

  • 企业需要DCIM工具来做什么?

    数据中心基础设施管理工具帮助管理员更深入地了解其IT基础架构和设施的性能。随着DCIM工具的逐步成长以及市场的不断发展,它们能提供更先进的功能,可以更深入地探究数据中心业务核心。

  • 因地制宜:为企业数据中心添加自动化

    如今,自动化是很多数据中心的建设重点,这个术语已与云计算融合。人们都在宣扬自动化,在某些情况下,IT人员甚至不确定什么是自动化或为什么需要自动化……