预防数据中心系统宕机:做好计划是关键

日期: 2011-08-03 作者:Robert CrawfordRobert Rosen翻译:王启 来源:TechTarget中国 英文

现代业务中最怕宕机。弥补宕机的损失并重建公司名声也不是件容易的事(如果还可能修复的话)。IT人员不指望能杜绝所有宕机的发生,但是大多数系统宕机是可以避免的。所以我们请到几名专家讲解如何减少宕机的发生。

这是本次答疑的第一部分。第二部分和第三部分请看《预防数据中心系统宕机:学会从错误中吸取教训》和《预防数据中心系统宕机:请把IT人员当人看!》。   Robert Rosen是大型机用户小组的领导,同时也是一名CIO。   你必须区分计划之内停机和没有预料到的系统宕机。

两种宕机都会给IT人员带来负担。计划之内的停机必须按时结束,而未经计划的宕机会带来更大的影响。这种宕机某种意义上是有益处的,可以作为……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

现代业务中最怕宕机。弥补宕机的损失并重建公司名声也不是件容易的事(如果还可能修复的话)。IT人员不指望能杜绝所有宕机的发生,但是大多数系统宕机是可以避免的。所以我们请到几名专家讲解如何减少宕机的发生。这是本次答疑的第一部分。第二部分和第三部分请看预防数据中心系统宕机:学会从错误中吸取教训预防数据中心系统宕机:请把IT人员当人看!

  Robert Rosen是大型机用户小组的领导,同时也是一名CIO。

  你必须区分计划之内停机和没有预料到的系统宕机。两种宕机都会给IT人员带来负担。计划之内的停机必须按时结束,而未经计划的宕机会带来更大的影响。这种宕机某种意义上是有益处的,可以作为故障检修学习实践的良好材料,因为我看到越来越多的技术人员缺乏故障检修技巧。我认为这是维修中“即购即换”理念和“重启即可”心态所带来的坏处。

  最大的问题是,宕机会让客户怎么看待你。考虑一下,若要执行计划之内的宕机,是白天好还是晚上好?你觉得客户会喜欢哪种做法呢?

  做好计划,让技术人员学好故障检修,记录你如何找到错误并加以解决,这样就可以从容面对以后可能发生的问题。

  Robert Crawford是系统工程师和大型机专栏作家

  大部分宕机的悲剧都是人为错误引起的。很多时候人们把不按程序做事,不考虑全局。系统问题或者不易察觉的设计瑕疵也可能造成无法解释的宕机问题。有时候,事情可能像排版一样简单。

  技术人员都想好好工作,所以出现故障是令人沮丧的。宕机带来的最直接的问题是“战场形势”(通常发生在非工作时段),这时所有人都在想该怎么解决。这种压力影响了士气,特别是经历了一系列霉运的时候。如果系统变稳定,情况就会好转。

  行业不同,运行中断的后果也不尽相同,尽管共同性还是有的。运行中断会导致公司机会减少,客户印象变差,因而导致失去销售机会。而制造商遇到宕机,可能得停止生产产品。金融公司可能得因宕机损失而赔偿罚金。

  预防宕机有两个最佳策略:计划和自动化。计划就是就想出改善和防范的最佳方案。当系统和应用的程序员设计富余的高弹性系统时,计划就可以投入使用。自动化则会减少人为错误的发生。

作者

Robert Crawford
Robert Crawford

数据中心专家

Robert Rosen
Robert Rosen

翻译

王启
王启

相关推荐