本文是这是TechTarget特邀专家对数据中心宕机答疑的最后一部分。 第一部分请看专家答疑:数据中心系统宕机的成因与代价(一) 第二部分请看专家答疑:数据中心系统宕机的成因与代价(二) 第三部分请看专家答疑:数据中心系统宕机的成因与代价(三) IT管理者较少注意宕机和运行中断的影响,但是一旦发生就会导致各种紧急事件。减少宕机的第一步是计划。如果运行中断了,却没有计划来应对,自然会带来极坏的长期影响。
如果受到良好训练而且准备充分,则会使系统环境更加稳定,一旦需要灾难恢复,也能保持稳定的环境。对灾难恢复计划的筹备、测试和实践可以让你的环境能够随时应对各种紧急情况。解决运行中断的问……
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
本文是这是TechTarget特邀专家对数据中心宕机答疑的最后一部分。
第一部分请看专家答疑:数据中心系统宕机的成因与代价(一)
第二部分请看专家答疑:数据中心系统宕机的成因与代价(二)
第三部分请看专家答疑:数据中心系统宕机的成因与代价(三)
IT管理者较少注意宕机和运行中断的影响,但是一旦发生就会导致各种紧急事件。减少宕机的第一步是计划。如果运行中断了,却没有计划来应对,自然会带来极坏的长期影响。如果受到良好训练而且准备充分,则会使系统环境更加稳定,一旦需要灾难恢复,也能保持稳定的环境。对灾难恢复计划的筹备、测试和实践可以让你的环境能够随时应对各种紧急情况。解决运行中断的问题没有秘诀,做的准备越充足,越能应对紧急情况。
对于IT部门和数据来说,只有稳定的环境,才有稳定的工作流程。无数的电话轰炸指责系统宕机,无疑是每个IT人员的噩梦,因为这样,IT人员不得不面对各种不必要的压力,而且还会增加在恢复过程中的失误率。把所有事情都一字不漏地计划好固然不可能,但是一定要尽可能做好准备,来减少任何可能会导致故障的因素。如果运行中断了,冷静下来解决问题。如果可能的话,尽量把所有情况记下来,指出故障的要点,在什么地方发生故障、需要修复什么,如何修复以及修复的结果。然后把该记录整合到你现有的灾难恢复计划里面。就算你可能会遇到没有记载过的紧急情况,但是也要尽量从发生过的事情中学到东西。在IT界什么事情都可能发生。
一个世界级的制造商可能要为一天的网络中断付出25万到35万美元的代价。没有准备,或者没有多余的备用系统,将会给你的公司带来长久的痛苦。
这意味着什么?在采购之初,IT管理者选择够买便宜的设备,不去买多余的风扇、供电设备、CPU等等,最后会自食恶果。例如能量骤增使某台只有一个电源的服务器停止工作,导致内部元件损坏,结果是整个环境都不行了,机器需要替换。假如这个IT管理者多花了点钱购买了更好的电源和配电设备来保护机器,发生了相同状况,只需进行简单的电源替换就行,而且几乎不会宕机。不过,一些看不见的因素也会暗中导致宕机发生。谁也不想因为无法应对宕机而早生白发,如果好好计划就能减轻压力。想必也没人希望自己的IT部门在执行委员会前丢脸吧。
如果业务经常需要IT环境,那就赶紧做好计划,这也没那么难。计划越多,基础设施越容易解决中断问题。从最简单的地方开始做好准备,这意味着数据中心应该有备用电源设备和休眠的虚拟机,或者有能够随时使用的hot site和warm site。还应该有多重的数据修复(云、局部、存储区网络和远程),并且定期测试这些方法。每个IT环境都需要一些灾难恢复方案。计划越充足,环境解决紧急问题的能力越大。问自己几个简单的问题:我有富余的网络服务供应商吗?他们在线路上一样吗?我有备用电源计划吗?我的电池都处于良好状态吗?我的虚拟环境能够解决物理主机问题吗?因为每个环境都是独一无二的,所以容灾计划必须紧扣基础设施的需求。工作人员也得同时了解主要系统和备用系统。还是那句话:准备得越多,网络环境越能够从容应对断电或宕机。
至此《专家答疑:数据中心系统宕机的成因与代价》系列技巧结束了,接下来,TechTarget将继续请几名数据中心资深专家具体讲解如何防止宕机事故的发生,敬请期待。
翻译
相关推荐
-
DR基础知识:灾难恢复计划和灾难恢复策略
IT灾难恢复(DR)计划的主要目标是制定详细的恢复计划,以在意外中断时执行。 这种计划应该列明详细步骤,说明在 […]
-
航空公司数据中心频宕机:仅靠DR远远不够
去年达美航空公司的宕机在平静的航空业掀起了涟漪,而后宕机事件可谓前赴后继。IT中断给乘客带来不好的用户体验外,也让航空公司遭受巨大的经济损失。那么航空公司有没有从这一起起事件中获得一些经验教训呢?
-
主机托管与DRaaS的真正区别原来是这样 你猜对了吗?
企业IT组织知道灾难恢复的重要性,然而要符合预算、内部专业知识和测试需求:是应该选择主机托管还是DRaaS呢?
-
高层专访:灾难恢复成本胜过效率
IT组织如何打破当前僵局?答案是快速的目标恢复时间(RTO)和高效率, 同时回避昂贵的灾难恢复成本。