在为高性能计算(HPC)选择托管服务提供商时,成功的合同谈判至关重要。由于存在特殊的硬件和管理要求,迁移工作负载比主流系统更具挑战性。
你的HPC需求可能会导致更高的运营成本,但不要让设施所有者尝试以远远高于标准主机托管设置的成本为你提供服务。
在协商HPC托管合同时,应该涵盖硬件可用性、连接性需求、设施标准和认证以及终止协议。
满足你的硬件和处理需求
你必须确保不仅为整个数据中心提供足够的电源来覆盖原始硬件,而且还要确保在可预见的将来提供预期的电源负载。
对于HPC,你的电源需求可能很高-不仅是整体,而且是在机架级。该合同必须涵盖你的近期需求,并包括设施所有者的未来计划,同时包括在整个设施级别以及更离散的每机架级别,以跟上你预期的处理和电力需求。
你可能很难预测未来的处理需求是否会保持不变、增长还是缩小。第三方云服务的增长意味着托管服务提供商可以随着时间的推移缩减其基础架构。因此,请确认提供者具有可用的基础结构。
在不久的将来,你不太可能将整个HPC工作负载移至第三方云。如果你的需求确实增加,在协商HPC托管条款时,请确认所有添加的硬件将与原始机架相邻或接近。你不必担心在两个不同设施按不同HPC设置运行两个机架的复杂性,即使它们位于同一托管位置。
为HPC托管建立正确连接
如果连接存在问题,即使架构和运行都良好,都将毫无用处。很多HPC工作负载具有相对独立的流量,但是,HPC基础架构越来越依赖于高带宽和高速数据流来执行分析。
请确保设施的连接已经可以满足你的需求-多冗余广域网连接具有足够的带宽来处理整个设施正在管理的流量以及你自己的可变需求。
当你协商HPC托管服务时,请查看并确认针对嘈杂邻居问题的设施协议,即限制客户的网络流量,以保持所有其他托管用户的一致性能。请确保合同明确规定,保持流量模式在商定的限制内,而不会使你被归类为嘈杂的邻居。
根据合同规定,如果你超出流量限制,设施所有者应在节流之前与你联系。寻找专用的高速连接(例如Azure ExpressRoute和AWS DirectConnect)来启用设施和公共云间的对等连接,尤其是在你的基础结构依赖于发送到或发送自这些外部产品的数据时。你还应该让合同涵盖持续访问。
检查HPC托管提供商认证
设施可能需要特定的认证,例如能源与环境设计先锋(LEED)或云工业论坛认证。HPC有自己的需求-特别是在安全性方面。
仔细检查设施是否具有国际标准化组织ISO 270001和20000-1认证,以及SSAE 18 SOC 1 Type 2、SOC 2 Type 2和SOC3认证。你可能需要将这些认证要求写入合同中,以及托管设备提供商如何计划监视和维护这种认证。
根据你企业所在行业,你可能还需要获得HIPAA或《支付卡行业数据安全标准》等认证,并在整个设施中确保遵守GDPR。
你还可以考虑某些安全标准或特定的部门认证。如果你拥有这些额外的认证,则如果设施所有者失去认证,则合同应涵盖所有维护要求和可用选项。
监控你的HPC设置
外部因素可能会产生多米诺骨牌效应,并会导致HPC托管设置瘫痪。为防止这种情况,你必须为你的硬件部署监视系统和软件,以及想方法获取有关主机托管设施中发生事件的信息。
确保主机托管设施具有其自己的完整监视系统,并通过门户的形式向你提供数据,或最好是数据源直接导入监控软件仪表板。
该合同应涵盖有关持续访问的信息,以及你可以向设施本身的管理员和帮助台提出多少突发问题。还应协商HPC主机托管补救条款和各种服务水平,并确认如果设施所有者未能维护服务级别协议,可以使用哪些财务补救选项。
审查合同和终止协议
如果你找不到短期托管合同,则最好选择长期合同。但是,你应该避免签订这样的合同,即让你面临低服务水平、价格过高或无法正确满足HPC托管需求。
你应该与托管服务提供商商定有关条款,例如终止协议需要多少通知,以及哪些条件可以作为终止的依据-对于你的企业和提供商。你必须接受设施所有者可能找到理由从他们的角度终止合同,因此请确保有足够的替代服务提供商。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号

TechTarget
官方微博

TechTarget中国
作者
数据中心专家,IT研究和分析公司Quocirca的联合创始人兼服务主管,该公司总部设在英国Longbottom,并在该领域拥有超过15年的经验。拥有化学工程背景,他从事工作过自动化,有害物质控制以及文档管理和知识管理项目。
翻译
相关推荐
-
值得考虑的8款主流基础设施即代码(IaC)工具
企业正在转向基础设施即代码(IaC)工具来自动化基础设施部署,以及简化应用程序开发,特别是因为它适用于DevO […]
-
6种可持续资源助力数据中心
为了降低能源成本、减少对化石燃料的依赖以及实现绿色倡议,至关重要的做法是转为使用清洁能源资源。现在有很多可持续 […]
-
微软推出量子芯片Majorana 1助力未来发展
微软宣称量子计算取得突破,使其可能在未来构建系统,以帮助开发药物、应对困难的环境挑战,以及为建筑和制造创造材料 […]
-
CPU、GPU和DPU之间有什么区别?
在计算中,处理器通常是指中央处理单元(CPU)。CPU是无处不在的处理器,但它并不是数据中心唯一可用的处理单元 […]