如何做好基础设施容量规划?

日期: 2015-10-26 作者:Robert McFarlane翻译:陈德文 来源:TechTarget中国 英文

遵循如下指南来扩展数据中心可用性,可以避免空间浪费,甚至还可以避免容量吃紧的问题。 这几乎是个不可能完成的任务,但依旧需要有人去做:预测未来的数据中心空间、电力和冷却需求。这个任务十分艰巨,而云计算的出现让基础设施规划变得更加困难。 数据中心的建造十分昂贵,而整治、升级或扩展都是破坏性的,存有潜在危险。

空间始终是非常难得的资源,所以不要索取比实际使用还多的空间。这同样适用于供电和冷却:相关电力设施也需要空间——有时候会比计算面积还要更多——而且也是扩张中最昂贵的部分。如果预估需要的能源比实际所能用的还要多得多,可能会导致数据中心项目失败或者成本节约措施问题。对能力的错误评估最坏可能导致职业生……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

遵循如下指南来扩展数据中心可用性,可以避免空间浪费,甚至还可以避免容量吃紧的问题。

这几乎是个不可能完成的任务,但依旧需要有人去做:预测未来的数据中心空间、电力和冷却需求。这个任务十分艰巨,而云计算的出现让基础设施规划变得更加困难。

数据中心的建造十分昂贵,而整治、升级或扩展都是破坏性的,存有潜在危险。

空间始终是非常难得的资源,所以不要索取比实际使用还多的空间。这同样适用于供电和冷却:相关电力设施也需要空间——有时候会比计算面积还要更多——而且也是扩张中最昂贵的部分。如果预估需要的能源比实际所能用的还要多得多,可能会导致数据中心项目失败或者成本节约措施问题。对能力的错误评估最坏可能导致职业生涯结束,并成为IT基础设施性能的负担。

没人可以做到100%准确,但也有一些指南可用于分析基础设施能力问题,以及未来可能的发展趋势,可以对数据中心能力有相对可靠的估计。如果采用合理的方法来提高产能,就可以证明这些要求。

IT 地面空间

图1 数据中心机柜需要的地面空间大于其本身占用的空间

IT工程师倾向于通过机柜数量来估算占用空间,但实际上需要考虑每个机柜实际占用的空间。一个机柜真正会需要占用多少面积?有很多方法来回答这个问题,所以选择其中一种方式来使用,并统一采用该规则。

机柜的实际占用建筑面积是机柜的实际长度乘以深度,但目前这种情况也在改变。机柜正变得越来越大以适应更高的设备密度,更深的服务器外形和更多的电缆连接。宽30",深48"(760*1,200mm)的机柜尺寸已十分普遍。

实际的机柜占用空间,根据ASHRAE TC 9.9定义,同样还包括了机柜周边的过道空间(见图1)。结构楼层负荷以及机柜内部与周围的热密度。如果设计安置一个30"x 48"的机柜,需要4'(1.2米)的过道,机柜占用的空间尺寸为2.5' x 8'或20平房英尺(1.83平方米)。你也可以单独计算机柜和过道区域的面积,但这种方法会更容易些。

机房场地

IT总工作面积等于机柜总数乘以机柜占地面积。如果要引入现代化的配电设备,还需要在每行额外增加一个大柜子。

计算用于配套的冷却设备,预留在行底的用于移动设备的额外空间,提供符合消防安全规范要求的服务。主要通道冷却可以轻松在机柜占用的场地空间基础上又额外增加75%至100%的空间。真正有效率的设计可能会需要更少的空间。相反,不良的形状和柱状填充房间会占用更多平方英尺的面积。尽管如此,有了这些主要数据,你应该不会严重低估或者高估需要的场地面积。

若要提高精度,需要提前为机房选择更先进的电力与冷却方案。即使是出于预估目的,不同选项的差异也并不显著:行冷却器就如附加机柜,应该排除最外围机房空调机的空间(CRAC);后门热交换器大约会增加6"(150毫米)的机柜深度,增加了机柜足迹,但几乎可以减少大部分的CRAC。

容量外包

想要预测IT能力需要多少机柜,可以联系主机托管或者代理运维的站点,或考虑用云实例取代。可从评估外包服务可行性开始,分析公司的服务外包规划。拥有管理,财务管理,参与制定共享业务方向并确保最终产品支持。

在评估时询问这些指导方针问题:

在不同系统的用户流失率分别是怎样的?经常变更的设备是基本不能中断的。托管站点需要收取大量金钱来支付基础设施费用,所以稳定的运营会比外包更经济。根据正在发生的变化,云服务器可能会比自己运维硬件更容易。列出你的系统,并分别注明各个系统离开数据中心的可能性。

你的运营风险承受能力怎样?具有高度安全与规避风险的需求不太可能考虑云计算选项。托管站点可能比你现有数据中心还不可靠,可能存在备用电源、冷却与连通性问题。分析系统的风险等级,对系统进行分级。

在需要大规模存储的运维,无论归档或是镜像操作,备份存储是否是个好的场外候选方案?

能源问题

本文采用实际的能量消耗来描述机柜密度。实际功耗远比铭牌额定值总量少得多。额定数值会导致数据中心设计时预留高出实际40%至60%的电力情况。请参考一下步骤选择适合企业规模的UPS系统。

能耗、冷却与密度

IT基础设施空间并没有包括设施的基础设施:不间断电源(UPS),水冷机组、水泵、主配电中心,发电机等中央设备。根据经验法则,需要额外准备至少50%总体数据中心的面积,根据Uptime Institute Tier II facility要求,而Tier III要求为75%,Tier IV要求至少100%。

压缩——数据中心设备越来越将更多能量装入更小尺寸的设备中——增加了每个机柜所需的电力和散热量。但这对实际的空间要求并没有太大影响,虽然设备变得更小也更强劲,我们需要的仍会越来越多。

根据实际情况规划能源。如果机柜都配置了计量配电盘,若还有使用数据中心基础设施管理软件来统计每个机柜的实际能耗,就可以准确判断出实际功耗负载。

密度并不是大问题。虽然预测为每机柜25-40kw,但数据中心内实际上只有小部分机柜超过8-10kw,而大部分任然在5-8kw范围。所以除非你正在运行高性能计算研究实例,整个机房跑满35kw满负荷的机柜是几乎不可能发生的。

图2.使用本图表来估算数据中心的电力消耗。

如果你无法确定当前的功率消耗,有三种方法来评估:

阅读UPS显示器面板。将总负载瓦特数除以机柜总数,可以获得每机柜平均瓦特数。如果你运行着2N UPS配置,每个UPS实际只承担了一半的负载,所以需要读取两个系统,把它们相加之后再除以机柜数。同样还需要计算非正常机柜的功耗,比如高利用率的刀片式服务器可能以每机柜12千瓦的功率运作。

查看分支电路板的断路器额定值。断路器应该在连续的基础上,只加载到总量的80%。使用图1来判断机柜电路的最大容量。如果机柜是双电路,能源来自两个不同的面板和断路器,最大负载只基于其中一个。

使用钳式仪表来测量每个分支电路上的实际负载。这些都是瞬时测量,不会影响当天的波动,但有主意估计真正的机柜负载。对于双路机柜,需要将每个断路器的负载求和。

捆版高密度机柜群组来整体预测空间。与其从整个数据中心水平上来设计,不如将其分割为高密度和正常密度需求,以此减少成本和空间。增加25%的面积用于真正的高密度机柜(15千瓦以上),考虑附加的功率和冷却需求。如果你想使用全冗余2N冷却系统,可以再增加额外25%面积。

变更设计

好的设计可以让扩充容量单元但不影响基础设施的运转。这样可以降低初期资金的投入,而且能在业务增加时灵活添加,最终实现高利用率。

坚持模块化的成本估算战略。没有理由在业务上线的第一天,就安装预测的最大规模UPS与冷却系统。否则会浪费大量的支出。

一些事情必须在新空间开始建造前完全安装好。管道和主配线必须有,否则当数据中心不断增长时,就会需要处理繁重的数据中心内部工作。后期在电器/机械支撑方面的扩展工作可能要求IT关机,这样就直接否定了你在基础设施规划上的所有功绩。

翻译

陈德文
陈德文

TechTarget中国特约编辑

相关推荐

  • 如何比较&选择合适的DCIM软件?

    DCIM软件提供网络监控、资产管理、容量规划和电源及冷却管理功能。通过软件套件了解您的需求,以及哪些产品将会是最佳适配您的需要。

  • 精简大型机系统管理的五项诀窍

    从容量规划到更高效的虚拟存储管理等等,市面上都有各种各样的工具及策略可以实现大型机性能的优化。在本文中,主要介绍了精简大型机系统管理的五项诀窍……

  • 迁移云端,关于容量规划、灾难恢复你都想好了吗?

    在将工作负载迁移到云端之前,管理员通常需要解决大量相关的问题,包括从软件即服务应用程序到灾难恢复以及容量规划

  • IT服务和机房升级计划

    在本篇技术手册中,我们为您整理了面对外界IT服务供应商时的一些注意点,这些对于IT治理有着极为重要的意义,在数据中心升级规划方面,我们也收集了本站的原创文章供您参考。