Nagios是否适合真的你的数据中心?

日期: 2010-09-29 作者:Roger Rustad翻译:张申佳 来源:TechTarget中国 英文

在许多数据中心的环境中,Nagios已经成为一些需要一个不仅是开源、而且有容错方案的公司的实质性标准了。这个方案具体包含了监控单点故障、服务等级协议(SLA)的缺陷、服务器、冗余交流链接或者环境因素。但Nagios这个似乎是“放之四海而皆准”的开源工具是否真正适合你的数据中心吗?   为了更好地回答这个问题,让我们来深入了解Nagios“简单”的设计原理(这里的“简单”是指一个“没有花哨装饰”的系统设计,并不指“使用简单”)。   在Nagios的配置文件里面编辑某些对象可以使管理员在网络服务,主机资源或者环境因素上做监控,警告和实施事件处理。

在同一时间,管理员也可以负责复杂的网络操作,比如主……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

在许多数据中心的环境中,Nagios已经成为一些需要一个不仅是开源、而且有容错方案的公司的实质性标准了。这个方案具体包含了监控单点故障、服务等级协议(SLA)的缺陷、服务器、冗余交流链接或者环境因素。但Nagios这个似乎是“放之四海而皆准”的开源工具是否真正适合你的数据中心吗?

  为了更好地回答这个问题,让我们来深入了解Nagios“简单”的设计原理(这里的“简单”是指一个“没有花哨装饰”的系统设计,并不指“使用简单”)。

  在Nagios的配置文件里面编辑某些对象可以使管理员在网络服务,主机资源或者环境因素上做监控,警告和实施事件处理。在同一时间,管理员也可以负责复杂的网络操作,比如主机分层,跳变服务和分布式监控。这些配置文件并不会把一些具体细节用糖衣包裹起来使之变得神秘,反而会给予管理员一个透明的、轻量级的工具(不管他们是否喜欢)。这个轻量级工具可以结合其它工具来分享它的设计原理。

  对于Nagios的一些批判或许会考虑部署Nagios所消耗的时间,比较难学和在重要任务的环境下不值得付出努力。但是,一些Nagios的倡导者,比如Chris Penn,一位NOAA南部气象中心(SRCC)的系统管理员不同意这些观点。Penn说在他看来,Nagios是最灵活并且是可以负担的起的一个可以针对天气模仿超星系团的监控工具。

  IT Duties的首席咨询师Leat Boafo也同样认为Nagios的学习曲线是值得付出努力的。象Penn一样,Baofo在他的数据中心里使用Nagios去操作数以千计的服务检查业务。

  有用的Nagios插件

  为了扩展Nagios的原始能力,Baofo将Nagios和第三方的插件如check_bl和check_AD集成起来。其他的一些插件包括:

  • NagiosQL (管理工具)
  • Fruity (GUI 端部前端)
  • Cacti (趋势分析)
  • Splunk (根本原因分析)
  • DNX (分布式检查)

  甚至是象Horizon Technology公司Windows系统管理员Ryan Villa这样的人士也能够利用Nagios的开源工具象NSClient++和NagiosPluginsNT去检查微软Exchange服务器和活动目录(AD)的健康状态。

  IT服务提供商Frontline IS的董事长和创始人Robert Ford也使用Nagios去监控他们网络合作伙伴的正常运行时间。他说到,“Nagios是可以使我们展示出运营商承诺客户的用来提供给第三方SLA认可的有效工具。我们的Nagios服务器在网络服务被中断的时候会创建一个故障事件单,当故障被排除的时候,他们就会关闭这个事件单。”

  获取Nagios技术支持的方式

  当问到他们是在哪里得到技术支持的时候,Penn、Boafo和Villa都回答说:“网络社区”。然后列出了几个网上的资源,包括:

  • Nagios documentation
  • he Nagios mailing list
  • 同行的Nagios会员网站和维基百科, 象NagiosWiki.com 和 NagiosExchange's wiki

  “网络社区技术支持对于一些较大型公司可能并不够用。”Ford提醒到,某些公司会提供商业化的Nagios的技术支持。“Nagios现场集成项目的质量管理变化很大,比如象SourceForge,这种企业级的客户往往需要一些专家的咨询,这些专家可以帮助引导他们获悉什么时候用一个功能相对较少但是稳定的工具,什么时候去测试一个功能更完善但是会比较有风险的beta版。

  数据中心环境往往缺少人手但是仍然需要Nagios,或许可以考虑Nagios的管理化服务。(基于Google的搜索,目前大概有6家这样的服务提供商)

  数据中心领域的鼻祖Dino Khoe警告说,如果不是谨慎地计划和仔细地记录,Nagios服务器(就象所有的服务器)可能会转变成一种“定时炸弹”。NagiosWiki.com的拥有者Khoe和CDN空间(Content Delivery Network Space)老板建议向那些新的Nagios集成商寻求可选择的项目,比如Oreon,甚至商业化方案,象Groundworks、Zabbix、或者Zenoss。

  Khoe说,“如果想要真正地来分析你的网络流量趋势,你不得不将Nagios和其他工具做集成,如Cacti或Smokeping,然后用Nagios去做监控和基于那些运行中的数据库状态来发出警告。

  像所有工具一样,Nagios也是一把双刃剑。“Nagios非常灵活,”Khoe说,“人们往往使用它去监控那些已产生的错误,而不是在错误还没出现前进行好好整理并以正确的方法去做。”

  Nagios不会去隐藏或者抽象化某些东西,这样那些熟悉配置文件的人可以轻而易举的修改某个参数而导致不利的影响。Khoe举了一个例子,如果一个管理员把告警时间从1分钟重新定义为15秒的话,问题就会随之而来,告警时间会出现显示错误和排队检查螺旋失控。

  或许选择Nagios的最大决定因素还是运作你数据中心的人,Khoe补充到。你的IT部门有多熟悉Nagios的基础平台?你的核心业务是否会依赖于一个人去支持?你会期望你的工程师去实施哪种类型的网络变更?最后,不管一个工具可以有多简单或多完美,以上这些问题才是主宰整个企业环境的主要因素。

  关于Nagios的更多安装和使用技巧,请点击下载《Nagios网络监控工具安装及使用指南》

相关推荐