在数据中心中,最至关重要的一项任务是对网络设备、服务器和数据中心本身的监控。大部分相关规划都集中在选择有效的监控解决方案和持续的数据中心网络设备管理办法方面。 一个有效的监控方案对于数据中心网络维护显得至关重要,在某种程度上是因为数据中心在大部分时间里往往处于无人管理的状态。多年来,我曾在许多数据中心工作,根据我的经验,基本上不会有人被派来专门盯着数据中心等候问题出现。
事实上,可能也不会有人长时间地待在数据中心。毕竟,数据中心往往又冷又吵,因此网络管理员更喜欢在其它的地方消磨时间。有时,管理员的工作地点甚至可能与数据中心不在同一幢大楼内。在从业之初,我所工作的一家大型保险公司的数据中心就像……
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
在数据中心中,最至关重要的一项任务是对网络设备、服务器和数据中心本身的监控。大部分相关规划都集中在选择有效的监控解决方案和持续的数据中心网络设备管理办法方面。
一个有效的监控方案对于数据中心网络维护显得至关重要,在某种程度上是因为数据中心在大部分时间里往往处于无人管理的状态。多年来,我曾在许多数据中心工作,根据我的经验,基本上不会有人被派来专门盯着数据中心等候问题出现。事实上,可能也不会有人长时间地待在数据中心。毕竟,数据中心往往又冷又吵,因此网络管理员更喜欢在其它的地方消磨时间。有时,管理员的工作地点甚至可能与数据中心不在同一幢大楼内。在从业之初,我所工作的一家大型保险公司的数据中心就像一个地下仓库。虽然数据中心是精心打造的,但只有保安人员定期在那里工作,其他人都在距此几英里之外的另外一栋大楼内工作。
无论管理员是在数据中心大楼内还是在几英里外的地方工作,都必须配置一套有效的警报机制。你不能只是设想恰巧有人走进数据中心并注意到控制台屏幕上显示了一个即将出现的问题。这就是为什么确保有一个良好的网络管理和监控方案是如此重要的原因所在。如果没有,那可能只有当报警铃声响起时我们才会意识到出了问题。
需要监控什么?
数据中心有很多不同的东西需要监控,因此我们需要制定大量的数据中心监控规划。有些人很可能认为数据中心监控就是一直密切地观察服务器的运行,但实际操作要复杂得多。比如,Microsoft's System Center Operations Manager在Windows Servers的监控方面做得不错,还可以部署到小型规划中。但尽管如此,如果我们的服务器运行的是非Windows操作系统,它也是无法发挥作用的。
除了服务器操作系统和应用程序之外,还有很多其它的因素需要我们进行监控。比如,对数据中心温度的观察也很重要。大多数服务器都配有内置安全机制,当服务器的温度超出某个特定值并且可能损坏服务器时,它就会让服务器停机。一个好的监控解决方案必须能够及时报告数据中心环境的温度,同时还应该能够在任何一台服务器的温度开始接近临界水平时向我们发出警报。
电源管理方面的情况也是类似的。当发生电源中断时,通常来讲备用电源会保持服务器在预先设定的时间范围内正常运行。更加复杂的数据中心也可能会依赖备用发电机。在任何情况下,我们都必须关注能源中断现象,我们也必须知道在任意给定时间中需要多少备用电源。
一个好的监控解决方案必须能够提醒我们关注服务器硬件问题、操作系统故障、应用故障、网络硬件故障和环境问题。这可以说是一个苛刻的要求,同时这也是为什么说适当的规划至关重要的原因之一。据我所知,没有一个监控解决方案可以同时执行所有这些功能。一般来讲,网络架构师需要同时购置几种监控解决方案,并且将它们都安装在系统上以发挥警报作用。这个警报可以以文本信息的形式发送到管理员的移动通信设备上,或者以邮件的形式发送到服务台,或是以其它警报形式提醒管理员。重要的一点是所有的警报最终都必须被汇集到一个地方。
虚拟化技术使数据中心网络监控变得复杂化
当我们采购监控解决方案时,我们必须铭记这其中有许多因素需要考虑,比如说虚拟化,它会使监控过程变得复杂化。例如,市场上有各种不同的可以监控服务器硬件失效信号的监控应用软件。诸如此类的应用可以监控到过高的服务器温度、SMART磁盘警报、甚至是服务器制冷电扇的失效。但问题在于,如果监控解决方案并不知道它是在监控一台虚拟服务器,它可能就无法监控到会潜在影响服务器可用性的硬件问题。
监控软件应该可以找出主机服务器硬件的问题。但是,当主机存在风险时,任何运行在主机上的虚拟机有可能也会存在风险。因此,当使用虚拟机时,我们需要有一种方法来区分物理服务器和虚拟服务器,并且知道哪些虚拟机是在哪些主机服务器上运行。同时,当发生硬件问题时,我们还必须能够快速地将客户机转移到其它主机服务器上。
最后要说的是,管理和监控是同步进行的。只有管理能力到位才可以实现良好的监控,特别是当员工不在现场工作的情况下。例如,当管理人员无法及时到达出现故障的服务器来阻止事故发生,如果监测软件可以告知我们将有重大故障出现,这该有多好?这就是说能够监控每台数据中心服务器和硬件核心部件并与它们实现远程交互是如此重要的原因所在。
关于作者:Brien M. Posey,MCSE,是微软在Windows 2000 Server和IIS领域的MVP。他曾经担任过国际连锁医院的CIO,还在Fort Knox公司负责过IT安全。作为一名自由技术撰稿人,他曾先后为Microsoft、CNET、ZDNet、TechTarget、MSD2D、Relevant Technologies以及其它技术公司撰写稿件。
作者
Brien M. Posey,微软认证系统工程师,Windows 2000 Server 和 IIS方面最有价值专家。Brien曾任全国性连锁医院的CIO,负责过Fort Knox的网络安全。作为一名自由撰稿人,他为微软, CNET, ZDNet, TechTarget, MSD2D, Relevant Technologies 以及其他的科技公司写过稿。
翻译
TechTarget中国特约技术编辑,某高校计算机科学专业教师和网络实验室负责人,曾任职某网络国际厂商,关注数据中心、开发运维、数据库及软件开发技术。有多本关于思科数据中心和虚拟化技术的译著,如《思科绿色数据中心建设与管理》和《基于IP的能源管理》等。
相关推荐
-
看IBM数据科学团队如何助力企业用户AI项目
在下面的Q&A中,IBM公司的Seth Dobrin探讨了如何提高企业用户对机器学习和AI项目的兴趣, […]
-
DR基础知识:灾难恢复计划和灾难恢复策略
IT灾难恢复(DR)计划的主要目标是制定详细的恢复计划,以在意外中断时执行。 这种计划应该列明详细步骤,说明在 […]
-
浪潮思科网络:开源和SDN给国产网络企业新发展机遇
数字化转型的冲击下,旧有的网络规则已经不再完全适应,SDN软件定义网络的新颖网络方式顺应而生……
-
维谛技术发布:维系数字世界真谛,开启网络能源新时代
11月16日,维谛技术有限公司(Vertiv)在北京雁栖湖国际会展中心召开“维谛技术发布会”,开启全新的品牌时 […]