现代业务中最怕宕机。弥补宕机的损失并重建公司名声也不是件容易的事(如果还可能修复的话)。IT人员不指望能杜绝所有宕机的发生,但是大多数系统宕机是可以避免的。所以我们请到几名专家讲解如何减少宕机的发生。
这是本次答疑的第一部分。第二部分和第三部分请看《预防数据中心系统宕机:学会从错误中吸取教训》和《预防数据中心系统宕机:请把IT人员当人看!》。 Robert Rosen是大型机用户小组的领导,同时也是一名CIO。 你必须区分计划之内停机和没有预料到的系统宕机。
两种宕机都会给IT人员带来负担。计划之内的停机必须按时结束,而未经计划的宕机会带来更大的影响。这种宕机某种意义上是有益处的,可以作为……
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
现代业务中最怕宕机。弥补宕机的损失并重建公司名声也不是件容易的事(如果还可能修复的话)。IT人员不指望能杜绝所有宕机的发生,但是大多数系统宕机是可以避免的。所以我们请到几名专家讲解如何减少宕机的发生。这是本次答疑的第一部分。第二部分和第三部分请看《预防数据中心系统宕机:学会从错误中吸取教训》和《预防数据中心系统宕机:请把IT人员当人看!》。
Robert Rosen是大型机用户小组的领导,同时也是一名CIO。
你必须区分计划之内停机和没有预料到的系统宕机。两种宕机都会给IT人员带来负担。计划之内的停机必须按时结束,而未经计划的宕机会带来更大的影响。这种宕机某种意义上是有益处的,可以作为故障检修学习实践的良好材料,因为我看到越来越多的技术人员缺乏故障检修技巧。我认为这是维修中“即购即换”理念和“重启即可”心态所带来的坏处。
最大的问题是,宕机会让客户怎么看待你。考虑一下,若要执行计划之内的宕机,是白天好还是晚上好?你觉得客户会喜欢哪种做法呢?
做好计划,让技术人员学好故障检修,记录你如何找到错误并加以解决,这样就可以从容面对以后可能发生的问题。
Robert Crawford是系统工程师和大型机专栏作家
大部分宕机的悲剧都是人为错误引起的。很多时候人们把不按程序做事,不考虑全局。系统问题或者不易察觉的设计瑕疵也可能造成无法解释的宕机问题。有时候,事情可能像排版一样简单。
技术人员都想好好工作,所以出现故障是令人沮丧的。宕机带来的最直接的问题是“战场形势”(通常发生在非工作时段),这时所有人都在想该怎么解决。这种压力影响了士气,特别是经历了一系列霉运的时候。如果系统变稳定,情况就会好转。
行业不同,运行中断的后果也不尽相同,尽管共同性还是有的。运行中断会导致公司机会减少,客户印象变差,因而导致失去销售机会。而制造商遇到宕机,可能得停止生产产品。金融公司可能得因宕机损失而赔偿罚金。
预防宕机有两个最佳策略:计划和自动化。计划就是就想出改善和防范的最佳方案。当系统和应用的程序员设计富余的高弹性系统时,计划就可以投入使用。自动化则会减少人为错误的发生。
翻译
相关推荐
-
迁移云端,关于容量规划、灾难恢复你都想好了吗?
在将工作负载迁移到云端之前,管理员通常需要解决大量相关的问题,包括从软件即服务应用程序到灾难恢复以及容量规划
-
IT业务连续性规划:托管方式与云端有何不同?
为了避免启用灾难恢复安全网络,应为数据中心构建IT业务连续性规划。然而在开始之前,我们要先权衡一下使用托管与云端两种方式的利弊……
-
数据中心灾难恢复报告:六大隐患点你中枪了吗
在这份灾难恢复报告中指出了一些导致大灾难的故障点,并说明如何做出正确的决定才能使数据中心正常运行。
-
2016年IT目标:DevOps及自动化
新的一年意味着一次机遇,许多IT专业人士也都怀着紧张的情绪期盼2016年在灾难恢复、DevOps以及其他项目在速度上会有所提升。