企业依靠他们的数据中心来支持他们的大部分业务,这意味着即使是一个小时的中断也会造成重大损失。无论你的企业使用专用数据中心还是托管设施,请确保你拥有合适的人员、流程和策略来维持正常运行时间。
为了构建和维护真正有效且可扩展的数据中心,你必须拥有合适的人员来监控和管理它。如果数据中心设施支持不足,可能会迅速破坏最完善的计划,使你的人员、基础设施和业务都处于危险之中。如果你有机会建立自己的数据中心设施团队,请确保你选择的人员拥有适当的专业知识、技能和培训组合,以确保你的基础设施和设施顺利运行。
为什么在数据中心设施管理中人员很重要?
研究表明,数据中心固有的复杂性使它们很可能遭受由人为错误引起的某种中断,这比其他业务设施高70%-75%。为了消除人为错误并确保足够的人员配备水平,企业需要雇佣和投资于技能熟练、以团队为导向的人员,以安装、维护和运营您的数据中心。
由于数据中心使用的基础架构类型(例如VM、虚拟存储和虚拟网络)、每天处理的工作负载以及IT维护周期,数据中心的管理环境可能具有挑战性。这些挑战需要多个团队进行仔细协调和规划,包括设施团队、基础设施所有者、企业所有者和用户以及高层管理人员。
由于有如此多的移动部件和投资的利益相关者,你必须确保各方之间进行良好的沟通和积极参与。拥有合适的设施团队和战略可以发挥重要作用,因为最终设施会影响公司的其他部门。你可以采取下面四个具体步骤,为你的组织创建一个有效、可扩展且有价值的数据中心设施团队。
步骤1:记录你的策略
管理和运营关键任务设施需要该设施的整个团队完全了解预期。使设施团队达成共识的第一步是,制定数据中心管理策略。这应该概述你设施的基础设施要求,以及你设施中服务的可用性,例如环境健康和安全、能源管理、应急准备和持续培训。
为确保该策略尽可能有效,请考虑向其中添加以下流程:
- 定期设施检查,可确保一切保持正常工作状态。检查发电机、水温、燃料水平以及电气和机械分配系统。
- 持续系统测试,使关键系统在规定的安全测试范围内运行。这包括定期负载测试和备份或故障转移测试。
- 预测性维护活动,可识别可能发生在潜在故障前的操作中的任何变化、趋势或异常情况。预测性维护使设施工作人员有机会在问题成为问题前解决问题。
- 预防性维护流程和程序可使关键人物系统平稳运行,并减少昂贵的临时修复。遵循制造商指南,以确定何时执行这些活动以保持系统正常运行。
- 当某个项目在其常规维护计划之外发生故障时,你应该执行纠正性维护活动,例如修复或排除系统或组件故障。这包括设施维护,例如修复泄漏,或更换有故障的HVAC部件。
步骤2:创建全面的团队
你的数据中心团队应包括特定设施领域的专家,例如电气、机械和操作控制;火灾探测和灭火;质量管理;建筑物管理系统和人员培训。如果该团队兼任你的基础设施或IT支持团队的双重职责,他们还必须了解DCIM产品等数字维护软件系统。
你的设施团队必须及时了解可能影响他们工作的行业趋势和变化,因此即使从长远来看,也要优先考虑培训。
步骤3: 开发独特的人员配备模式
你的公司应该针对自己的设施、业务职能和运营任务制定特定的人员配备模型。考虑一下支持的覆盖范围要求-例如你是否只有白天工作时间还是24/7全天候运行,紧急响应需求、维护活动工作量、项目监督要求和你的运营预算。
定期分析设施维护范围的定期,这可帮助确定这些活动的人员配备要求,还可以帮助你更好地分配和预测资源及预算。最终,你系统的任务关键性和停机成本决定你的覆盖范围。
步骤4:定义并记录角色和职责
很多公司在其数据中心人员管理中包含角色和责任文档。考虑一下运行数据中心设施所涉及的各种角色和人员,从设施经理和数据中心管理员,到利益相关者以及受数据中心变化影响的人。
应明确定义每个人在设施团队和他们参与的其他团队中的角色和职责。明确定义的职责可作为基准,以评估技能和绩效以及设定成长和培训目标。 此外,这还可以帮助你的企业避免协作问题,即信息在某些组内被隔离,或者人们在其域外工作。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
翻译
相关推荐
-
英特尔收益超预期,但AI芯片Gaudi令人失望
尽管在快速增长的数据中心AI芯片市场遭遇挫折,但芯片制造商英特尔的最新收益报告让投资者感到乐观。 在10月31 […]
-
英特尔、AMD成立x86联盟,联手对抗Arm
英特尔和AMD成立了一个x86咨询小组,以提高互操作性,并避免未来市场份额流向Arm处理器。 X86生态系统咨 […]
-
博通CEO称,VMware平台是对用户的投资
在宣布公共云给IT团队带来“创伤后应激障碍”大约一个月后,Broadcom总裁兼首席执行官Hock Tan正试 […]
-
针对数据中心的平台工程最佳做法
现在企业需要更快的应用程序开发周期,这需要简化DevOps工作流程。新兴学科–平台工程提供对常见、 […]