在一次系统宕机或灾难发生后,大多数企业都能意识到确保系统高可用性及对核心应用和数据进行迅速灾难恢复的重要性,从而为企业避免经济损失。但是,通过与众多IT机构的沟通,我发现只有很少企业能够实现技术成本与企业需求的平衡。 大多数IT机构并不知道他们的核心业务应用及数据是否已得到相应的保护。他们往往会利用他们认为合适的技术,但却经常发现在这方面的投资有些过多,这样做或许是为了满足某一两项核心应用的需求(实际上他们也不是很确信),殊不知对于所有其它应用而言这显然有些过盛了。
大多数IT机构都知道,实施BIA(业务影响分析)可以帮他们选择合适的技术来阻止业务的流失。然而,我发现几乎所有的企业在初……
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
在一次系统宕机或灾难发生后,大多数企业都能意识到确保系统高可用性及对核心应用和数据进行迅速灾难恢复的重要性,从而为企业避免经济损失。但是,通过与众多IT机构的沟通,我发现只有很少企业能够实现技术成本与企业需求的平衡。
大多数IT机构并不知道他们的核心业务应用及数据是否已得到相应的保护。他们往往会利用他们认为合适的技术,但却经常发现在这方面的投资有些过多,这样做或许是为了满足某一两项核心应用的需求(实际上他们也不是很确信),殊不知对于所有其它应用而言这显然有些过盛了。
大多数IT机构都知道,实施BIA(业务影响分析)可以帮他们选择合适的技术来阻止业务的流失。然而,我发现几乎所有的企业在初次采用BIA时都会犯一个错误。
避免员工的麻烦是不是一个关键业务?
企业最常犯的一个错误就是在确定服务等级需求、RTO及RPO时试图保持业务的持续运营,就像什么事都没发生一样。
企业总是试图去解除其雇员及整个业务进程的麻烦,但这些麻烦事通常不会导致业务的流失和成本的浪费。是,有一种成本是与这些麻烦相关的,但大多数情况下,流失的是短期的机会成本因为员工必须采用手动业务流程。
这有个例子:我曾经跟一个组织严密的公司聊过,他们的IT部门要负责为公司内的业务部门提供服务。有一个业务部门来找IT部门要求灾难恢复RTO不超过15分钟、RPO时间不超过5分钟,其企业资源规划(ERP)系统也要从早上5点到晚上9点保持正常运行。这还是我第一次听说有人要求ERP系统的弹性等级,一般情况下企业要求的RTO是24小时,RPO是4小时。
IT组织会保证相应的成本能够满足他们的目标。粗略的估计一下,所花的费用是正常处理ERP系统费用的2.5倍。可复原性就更别说了,是正常使用的9倍。IT服务机构接下来一定会拿着正常花费单据和相应部门的要求所需的成本去找相应部门,然后问他们一个问题:“你们是不是准备通过提高服务等级的办法来解轻雇员的麻烦。
在停电期间,手工处理进程的确会给员工带来一些麻烦,但大多数情况下它都可以降低业务连续性的成本。在最近的一份灾难恢复预算调查中,我引用了一个例子,有一家分销商选择了部署手工处理进程来代替为实现数据中心冗余网络连接而花费200万美元。在数据中心网络连接中断期间,员工连续奋战36小时,他们通过电话、纸以及笔来记下订单,使分销商可以在下午五点之前将所有货物装船。但经过计算发现还是可以节省很多成本,即使是与停电期间相比。
一些例外
有些情况比较特殊,员工所面临的麻烦因素是在所难免的,因为这会威胁到人们的生命财产安全。911事件是一个很好的例子,在那种情况下,时间就意味着生与死的差别。
此外,有时候员工所要面对的麻烦也正是用户所面临的困难。当确定用户是否面临危机时要考虑诸多因素。在充满竞争的市场上,一个电子商务网站的宕机对企业来说就是一次财政危机。如果在宕机期间客户不能买到他们期望的产品和服务,他们就可能会转而投向企业的竞争对手。这样企业就可能会永远的失去这些用户。
在业务安全弹性与成本之间寻找平衡
紧缩的预算及对于降低成本的持续性压力使IT机构不得不对业务系统进行仔细审查,并找到业务安全弹性与其成本间的平衡点。要想实现这种平衡,企业首先要创建一个全面的BIA对一次宕机事故对业务开支的实际影响进行评估。一种可能是,企业为了追求更高的弹性而增加开支;另一种可能是,企业在安全弹性方面达不到要求而使自己抵御灾难的能力降低。不同的系统安全弹性会对企业财务产生不同的影响。最好的效果是在两者之间找到平衡。下图所示的是不同系统弹性等级对企业业务的影响,期中涉及的是一家年营业额8亿美元的电子商务企业。
左侧的粉色区域表示的是该企业在系统安全按弹性方面的开支,右侧粉色区域是这种开支状况下企业的风险等级。在这个例子中,企业的平衡点是每年宕机次数不超过一次,每次宕机恢复时间不超过一小时。
翻译
相关推荐
-
迁移云端,关于容量规划、灾难恢复你都想好了吗?
在将工作负载迁移到云端之前,管理员通常需要解决大量相关的问题,包括从软件即服务应用程序到灾难恢复以及容量规划
-
IT业务连续性规划:托管方式与云端有何不同?
为了避免启用灾难恢复安全网络,应为数据中心构建IT业务连续性规划。然而在开始之前,我们要先权衡一下使用托管与云端两种方式的利弊……
-
数据中心灾难恢复报告:六大隐患点你中枪了吗
在这份灾难恢复报告中指出了一些导致大灾难的故障点,并说明如何做出正确的决定才能使数据中心正常运行。
-
2016年IT目标:DevOps及自动化
新的一年意味着一次机遇,许多IT专业人士也都怀着紧张的情绪期盼2016年在灾难恢复、DevOps以及其他项目在速度上会有所提升。