Gartner数据中心:监测系统为重中之重

日期: 2012-01-17 来源:TechTarget中国 英文

  首先,我不得不说,我很少看到人们如此自觉的参加会议。匆忙的早餐之后,大家纷纷出席会议,午餐和主题聚会的讨论也相当热烈。在晚上的解决方案中心讨论时刻,人们贪婪地吸收各种参展商的信息。即使白天在走廊里,也有相当多的人在不停的交流意见和信息。与会人员都十分认真的在向演讲者、供应商、以及他们的同行学习。

  最重要的是:避免停电,加快恢复

  现在,让我们来看看与会者们心中最重要的问题是什么吧。我有点惊讶地发现,这一主题并非通常情况下CIO们/或者IT专业人员们所最为关注的十大问题之列。与会者们反复表示感兴趣的话题是如何避免停电和增加在断电后快速恢复服务的速度、以及如何更好的监测,以帮助实现上述这两个目标等相关话题。

  诚然,这是一次关于数据中心运营的具体会议,因此很自然的,避免停电和恢复操作失误是至关重要的。但与此同时,我们也听到很多其他的关于数据中心运营方面的倡议,如虚拟化、云迁移和数据中心整合。这些引人注目的主题都是相当重要的。然而,关于如何避免停电,并加快断电恢复的这个问题则是至关重要的,其影响到数据中心业务领导们的日常工作和事业。

  基础仍然相当重要

  为什么?很简单。其中的一些倡议看上去很新。但监测已经成为了永远的话题。另外,从某种程度上,断电是不可避免的。同时,零故障的确是不可能的,但显著提高的可靠性则是可以达到的。从电信服务供应商方面的历史来看,“五个九”级可靠性是预期的服务水平。当期望很高时,自会进行相应的投资,更高水平的可靠性便指日可待。

  至于监控解决方案本身,现在你不必局限于老派系统。有诸如Circonus这样年轻的公司,可以采取新的方法,上下突破过去独立的工具集。

  现在让我们退后一步,想象一下断电对于一家数据中心来说到底意味着什么呢,即到底什么事情会“引爆”一家数据中心。其实,大部分时候,并非外部诸如客户等因素直接影响数据中心。外部的客户所接触到的一般都是业务联系部门,然后由业务部门与数据中心的领导们联系。

  而关于服务水平协议(SLA)则保持业务部门通报他们的利益?在Gartner的大会上,我明确的听到关于企业内部的SLA大部分是无用的的言论。为什么呢?因为他们对企业的业务部门没有太大意义,业务部门所感兴趣只有“你何时对我的服务进行备份?!”换句话说便是“你最近为我做了什么?”

  让我们看看一个备选的解决方案选项。如果问题发生在一台虚拟机,你可以组建一个新的实例,对吗?错,但通常人们就是这样处理的。当吊货架上的一个锤子晃来晃去打中你的头,你会用另一个挂锤来替代,并认为你已经解决了这个问题了吗?显然,我们在数据中心所需要做的工作就是要避免重复的问题再次出现。我们必须进行根本原因分析,否则你会反复遭遇到相同的火灾。

  一个好的监测系统将在多个方面提供帮助。首先,它协助找出潜在的问题,包括这些问题的位置:是在应用程序中、数据库、还是服务器中。这样,你不必要进行盲目的测试,其可以帮助你创建表格,方便快速地做好相关指标。

  好的,这样的补救问题随着降低的机会,它再次发生。但是你还想要做的预期行为能力计划避免瓶颈垄断。为此,你还需要一个易于使用的工具,所以你不用耍弄电子表格。你会希望能有一个“播放”功能,当你在处理比如codepush时,你就可以实时看到这些变化的影响。这样,如果codepush的效果是负的,你可以迅速扭转操作,而不会影响您的内部或外部客户。

  好消息是,所有这些功能的新的解决方案在市场上有。-当然,在你购买一台,一定要坚持在试验测试的解决方案如何执行,在您的当前和预期(阅读:物理和虚拟混合/云)环境。这包括看到的解决方案是如何处理你的规模,无论后端,从UI的角度来看。这样的评价,将需要你投资时间,但这样做的结果将是非常值得的,其将帮助您避免停电的增加,并加快恢复时间。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

相关推荐