多年以来,IT过程控制一直都是IT企业和管理生产厂商的一个主要焦点。 有些企业和生产厂商一直都期盼着实现跨域(cross-domain)IT过程。由于机构间的政策和文化障碍,这将是一个更加长期的任务。不过,要在自己的服务器域内实现自动化管理,数据中心技术人员还是有很多事可做。
服务器自动化入门 尽管“自动化”一词会让某些管理员感到害怕,但它事实上代表着计算能力的广泛进步,从简单的、低级的任务自动化到复杂的操作过程。自动化的部署必须保证它会执行应该执行的任务。在部署过程中,之所以测试和校验非常重要,就是由于这个原因。 说实话,在架构或服务器级实行自动化容易得多,因为服务器管理员对……
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
多年以来,IT过程控制一直都是IT企业和管理生产厂商的一个主要焦点。
有些企业和生产厂商一直都期盼着实现跨域(cross-domain)IT过程。由于机构间的政策和文化障碍,这将是一个更加长期的任务。不过,要在自己的服务器域内实现自动化管理,数据中心技术人员还是有很多事可做。
服务器自动化入门
尽管“自动化”一词会让某些管理员感到害怕,但它事实上代表着计算能力的广泛进步,从简单的、低级的任务自动化到复杂的操作过程。自动化的部署必须保证它会执行应该执行的任务。在部署过程中,之所以测试和校验非常重要,就是由于这个原因。
说实话,在架构或服务器级实行自动化容易得多,因为服务器管理员对服务器架构享有绝对的控制权,而且具备所有必需的专业知识和技能。那么,一个系统管理员第一次应该如何着手执行自动化呢?首先,你可以从一些简单的、重复性的任务开始,这样的任务易于记录、执行、测试和校验。然后,再进一步执行更广泛的自动化。
开始时,系统管理员可以先设置停止和重启服务器或过程这样的任务,或创建一段诊断命令,在问题出现时启动。例如,如果一个用户打电话说他的PC无法正常工作了,可以启动一系列任务来检查该PC的问题,如ping一下该设备,如果没有反应,再ping一下它连接的主机。这将会比较复杂。
尽管自动化任务在被触发后会自动执行一系列动作,但管理员起先并不一定会自动执行它。不过,他们可以手动执行。一旦他们信任了这个过程并觉得这样做有好处,他们会对预定义的错误情况做出反应,自动执行该过程。
自动化有多种不同的程度。自动化的程度主要取决于管理员采用自动化后的轻松程度和自动化对特定情况的实际意义。
自动化可以减轻管理员的工作负担,减少很多浪费时间的低级任务。将这些低级任务编成一个自动化过程后,管理员可以节省很多时间。或者,也可以将这些自动化任务交给水平低一些员工去做。因为,“专家”已经编好了需要完成的步骤,剩下的工作当然应该由下面的人去做了。
管理员的技术要好一些,他们可以完成价值更高的工作,自动化可以为技术好的管理员赢得很多时间。换句话说,管理员可以把时间和精力集中到更有价值的别人做不了的工作。例如,解决一些无法实行自动化的问题。这些问题往往需要人为的干预和决策,所以无法实现自动化。
请记住,自动化并不是一个是非命题。我们应该有选择性地应用自动化,在意义和价值最大、能够降低工作复杂度的情况下使用。看看生产厂商们在他们的哪些解决方案中加入了自动化,然后加以利用。许多管理厂商是将自动化功能嵌入到它们的产品发布中的,有的很明显,有的却很难辨认。有些发布会包含预建最佳做法模板以便快速部署,而有些发布提供一些自动化的功能。你可以自己将这些情况都搞清楚。
自动化厂商提供
本文以下内容为一些厂商提供的自动化功能实例。在本文前面我们已经提到,自动化功能有很多种:配置、电源/散热管理、监控、性能调制、容量、故障检修(troubleshooting)、管理过程等等。下面一些例子只是一个实例。
Opalis和RealOps等解决方案为设计、整合和执行操作手册(run book)中的过程提供了一个平台。这些解决方案允许进行分级过程设计。分级过程设计可以再利用低级操作过程创建更复杂的综合过程。运行资料自动化(run book automation)有一些内建功能,可以帮助创建自动化过程,它让现有操作过程的创建维护和现有管理工具的整合变得更加简易。此外,用户还可以利用预建最优做法开发新的自动化过程。
HP近期发布了Insight Power Manager,如果你担心服务器电能使用和冷却需求,可以用它帮助你测量和调节HP服务器电能利用。它提供了实际的电能和热量信息,通过这些信息可以了解机架的电能和冷却余量。不过,最有趣的是它能自动调节处理器的时钟频率,在处理器需求低时降低其时钟频率,反之亦然。这可以节省能耗和减少发热,而且不会对性能有任何负面影响。
当处理器需求达到80%以上时,Insight Power Manager会自动恢复最大处理器时钟频率,以满足更高的需求。这不仅有助于管理员通过管理能耗和发热量从而管理服务器机架密度,还可能减少浪费、节省成本,尤其是大型数据中心环境。
服务器报警阈值的设置可以说是一个凭借猜测、经验和反复试验的过程。准确的阈值设置应该是一个平衡点:如果设置太高,等发现问题时就已经为时晚矣;如果设置太低,控制台报错警报将连连不断。Netuitive SI可以根据统计数据分析和“相互关系法”进行动态阈值设置。所谓相互关系法,就是了解正常服务器的行为,探测反常行为。随着操作环境的改变,服务器阈值也会自动得到维护。
这些仅仅是一些管理产品中的服务器自动化功能实例罢了。自动化解决方案的自动化宽度和深度正在日益扩大。尽管服务器自动化不是一种魔法,但对管理员来说感觉就像魔法一样。其实,我们每个人都可以利用到一些自动化“魔法”,难道不是吗?
翻译
相关推荐
-
看IBM数据科学团队如何助力企业用户AI项目
在下面的Q&A中,IBM公司的Seth Dobrin探讨了如何提高企业用户对机器学习和AI项目的兴趣, […]
-
DR基础知识:灾难恢复计划和灾难恢复策略
IT灾难恢复(DR)计划的主要目标是制定详细的恢复计划,以在意外中断时执行。 这种计划应该列明详细步骤,说明在 […]
-
为超融合架构选择合适的数据中心冷却系统
超融合基础架构会给新的数据中心冷却方面带来一些新的挑战,在选择和实施之前,我们来看看哪些温度和冷却单元的效率是最好的……
-
IDC Directions 2017:值得期待的智能数据中心技术
智能技术能够让数据中心变得更为自动化、简单,不过企业需要为其实施做好准备,了解如何从旧的设备平稳过渡至智能的数据中心。