IT治理:提高企业业务连续性的“必杀技”

日期: 2010-08-04 来源:TechTarget中国 英文

  信息化是当今潮流,我们不能避而远之的。实施业务连续性管理(BCM:Business Continuity Management,)是确保业务体系连续有效地运作,未雨绸缪地防范各种突发事件,以尽可能低的成本全面提高业务系统的可靠性和可用性的关键。
  
  IT治理
  
  IT治理是信息系统审计和控制领域中的一个相当新的理念,IBM最早将此理念引入中国。IT治理是公司治理在信息时代的重要发展,用于描述企业或政府是否采用有效的机制,使得IT的应用能够完成组织赋予它的使命,同时平衡信息技术与过程的风险、确保实现组织的战略目标。IT治理是公司治理的一部分,对于公司治理,1999年出版的《公司治理的基本原则》一书所下的定义为:为确定组织目标和确保目标实现的绩效监控所提供的治理结构。
  
  1、IT治理的业务连续性管理
  
  IT治理是公司治理的一种具体表现,用于描述企业是否采用有效的机制,使得IT的应用能够完成组织赋予它的使命,同时平衡信息技术应用过程中的风险,以确保实现组织的战略目标。因此,IT治理主要涉及两个方面:IT要为企业交付价值,同时IT风险要降到最低。其中保持业务连续性管理是降低IT风险的一个具体体现。
  
  IT治理业务连续性管理系统关注的是企业在突发事件后,应对风险自动调整和快速反应的恢复能力。包括如何应对灾难事件以及在事件之后如何恢复正常的运转,还包括应对措施的演练。虽然业务连续性计划无法预防灾难的发生,也无法解决灾难到来时企业遇到的所有问题,但是它至少可以为企业提供一个减少损失的备选方案。参照英国标准化协会BSI的BS25999标准,IT治理业务连续性管理包括灾难恢复、危机管理、风险管理。具体内容主要有三个方面:①是高可用性,是指提供在本地故障情况下,能继续访问的能力。无论这个故障是业务流程、物理设施、IT软/硬件的故障。②是连续操作,是指当所有设备无故障时保持业务连续运行的能力。③是业务恢复,是指当灾难破坏业务应用时,在不同的地点恢复业务的能力。
  
  一般而言,业务连续性恢复的级别越高,其成本越高,所以业务连续性管理很重要的一项工作就是评估最优化的成本与时间方案,找到最佳结合点。因此,找出业务最大容忍的中断时间,是非常关键的一步。建立业务连续性系统BCM有两个重要指标:RTO和RPO。RTO是恢复时间目标,是指灾难发生后从IT系统停机导致业务停顿开始,到IT系统恢复可以支持业务恢复运营时所需要的时间。RPO是恢复点目标,是指能够恢复至可以支持业务运作,系统及数据恢复到怎样的更新程度。它可以是上一周的备份数据,也可以是上一次交易的实时数据。简单的说:恢复时间目标(RTO)是最大可允许中断时间;恢复时点目标(RPO是数据损失可允许的最远回溯时点。
  
  2、建立高效保障业务连续性系统的步骤
  
  (1)业务连续恢复方案,不能光建不练
  
  IT治理业务连续恢复方案是为了减少灾难发生后带来的损失,和保证IT系统所支持的关键业务能在灾难发生后,及时恢复和继续运作所作的事前计划和安排。因为灾难业务连续恢复系统只在灾难发生后才会考虑启用,在企业日常运营中并不投入使用。所以,即使业务连续性计划存在有问题也不会立即暴露出来。基于这个原因,业务连续恢复计划不能光建不练。
  
  也就是说,制定好IT治理业务连续恢复计划后,并不是万事大吉和束之高阁,不经过演练的计划方案无异于纸上谈兵。但很多企业并没有意识到这一点,往往花费了大量的人力和物力制定了IT业务连续恢复系统就以为万事大吉了。殊不知,在IT灾难状态下这些措施并不一定有效。所以,即使建立了业务连续恢复计划,测试和演练也是非常有必要的,而且这也是有效的IT治理必不可少的关键一步。

  (2)风险分析,明确需要防范的灾难类型
  
  一般来说,灾难风险可分为突发性和渐进性两大类。企业需要考虑要预防哪些灾难风险,这些灾难风险会使业务中断多久等。针对不同的灾难风险,实现业务连续性技术保护手段时也是有所区别的。根据各行业的特点和国际上相关机构的调查,硬件故障、人为错误、软件错误居信息系统故障发生概率的前三位,而自然灾害是属于小概率事件,但由于破坏力大也是业务连续灾备系统必须防范的重要内容。也就是说,通过风险分析,明确IT系统需要承受的灾难类型,并对诸如系统故障、硬件故障、数据受损、火灾及地震等各种意外情况采取的合适的备份和保护方案。同时,针对不同的灾难风险等级,它们的防范策略应该是不尽相同的。
  
  (3)依据业务关键程度,设定灾难容忍时间指标层次
  
  对于业务连续性系统来说,它毕竟是一个IT容灾系统,在灾难发生后需要有一个恢复的过程。解决这一问题的方法是对企业的业务采取全局审视的态度,先将最关键的应用以最快的速度恢复出来。业务连续性规划中最关键的是:了解对企业最重要的东西,因为全面恢复是需要很长时间的。因此,必须明确当IT系统发生意外无法工作时,依据业务停顿所造成的损失程度,设定用户对于IT系统发生故障的最大容忍时间,这也是设计IT治理业务连续性方案的重要技术指标。
  
  通过业务影响分析,估计业务停顿随时间而造成的损失,进而确定对该企业而言比较合适的RTO和RPO容忍时间指标。通常企业规模大,要求的RTO恢复时间越短;而RPO恢复点目标的确定则不是依赖于企业业务规模,而是决定于企业业务的性质和业务操作依赖于数据的程度。所以,对业务关键程度进行分析,设定灾难容忍时间指标层次,以调整控制措施是很有必要的。
  
  (4)成本控制,平衡风险等级和业务连续性的关系
  
  一般来说,业务恢复目标应是越短越好,但这同时也意味着更多成本的投入,即可能需要购买更快的存储设备或高可用性软件。因此业务连续性应当根据业务恢复的总体成本对最关键的应用进行权衡。因为把一切都立即恢复出来通常是不现实的作法,如果企业并不是立即需要某些业务数据,却为这些业务数据制订高恢复等级就是在浪费时间、精力和金钱。当然如果企业有足够的钱,完全可以创建任何一种解决方案。
  
  但在多数情况下,却不必如此。因为有时企业的某些业务并不需要迅速的立即恢复。根据不同的恢复目标和实现方案,灾难业务连续技术方案一般可分为七个级别。在这七个级别的灾备方案中,随着灾备目标不同,方案及成本也有不同。简单的说,就是恢复时间要求越短,成本越高。所以,合适的IT治理业务连续性管理方案应是基于风险等级和成本相应平衡的。
  
  (5)业务影响分析,制定所需防范的灾难范围
  
  业务影响分析是指根据业务需求来定义所需防范的灾难范围和相关参数。分析包括定性或定量分析关键业务中断的影响或损失、确定关键业务功能的损失标准、确定最大容忍时间指标、制定恢复的优先顺序。然后,对业务重要性进行分类,分别考察决策时间、评估时间、等待时间,进而准确定义RTO和RPO。
  
  简单的说,业务影响分析主要是识别出企业的关键业务活动和企业对这些关键业务活动所能容忍的业务最大中断时间,并对这些业务所依赖的要素进行分析,最后按照恢复的优先级排序并确定出关键活动。总体说来,是分别定义事件的重要和紧急程度,对于最重要、最紧急的事情,进行重点及时处理。对于紧急的灾难事件,容忍时间限度要放宽,可用灾难级DRTO、DRPO(Disaster Recovery)来衡量;而对于日常工作中的普通问题,时间限度则要变小,要求必须实时备份,在系统故障发生时及时追回数据。可用运行级ORTO、ORPO(Operational Recovery)来衡量。
  
  目前,中小企业纷纷加入IT治理之中,加快了企业发展进程。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

相关推荐