近日,Google公司第一次允许媒体记者进入其位于世界各地的数据中心进行参观拍摄,向世人展示其迷宫一样的世界。这些中心的处理器日以继夜地处理着全球网民的搜索请求、Youtube视频和邮件等。虽然公布的只是一些图片和非常有限的视频资料,且没有详细注释说明,但如古老的谚语所述:一张图片胜过千言万语,今天我们就这些有限的图片管中窥豹,更多的是猜测,分别从制冷、机柜、服务器、建筑等方面做一些最粗浅的分析以飨读者,并与同行们共勉。 一、制冷篇 从下图可以看到这个数据中心的冷站规模很大,整个房间管道林立,并且色彩斑斓非常好看。
空调管道采用了Google企业标准色来区分不同管路的功能,比如绿色是冷却……
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
近日,Google公司第一次允许媒体记者进入其位于世界各地的数据中心进行参观拍摄,向世人展示其迷宫一样的世界。这些中心的处理器日以继夜地处理着全球网民的搜索请求、Youtube视频和邮件等。虽然公布的只是一些图片和非常有限的视频资料,且没有详细注释说明,但如古老的谚语所述:一张图片胜过千言万语,今天我们就这些有限的图片管中窥豹,更多的是猜测,分别从制冷、机柜、服务器、建筑等方面做一些最粗浅的分析以飨读者,并与同行们共勉。
一、制冷篇
从下图可以看到这个数据中心的冷站规模很大,整个房间管道林立,并且色彩斑斓非常好看。空调管道采用了Google企业标准色来区分不同管路的功能,比如绿色是冷却水回水管、黄色是冷却水供水管、蓝色是冷冻水供水管,深红色(或者冷机侧的粉红色管)是冷冻水回水管,白色的是消防管路等来区别不同的功能,以便运维人员快速定位并查找问题。还有在IT设备侧也采用同样五种颜色的网线等,加上不同数据中心不同主题的装修风格,这些都是数据中心颜色标识管理的典范。下图的左侧是大型冷水机组,右侧是板式热交换器,以便在室外温度较低时候采用板换散热实现水侧节能。Google也非常重视数据中心的耗水问题,据他们估算采用高效节能数据中心每年可节约几亿加仑的饮用水。
还有一些运营中的小细节也考虑非常周全,比如管路屋顶等地方采用了很多的电动吊装葫芦链条方便重型设备的维护更换吊装,比如在管路底部采用了中间凹两边凸的滚轮型支撑,减少管路振动和拉伸形变产生的物理应力,比如楼层间的竖管采用了U型弯曲以便减少水温变化和建筑形变带来的隐形损伤,以及冷机周边地面的应急排水口,最后在偌大的机房中运营人员采用同样是Google标准色的G-bike用于现场巡视等运维和工艺细节。
二、微模块机柜篇
下图为美国俄克拉荷马州的数据中心,整个机房在大量服务器LED指示灯的闪烁下显得非常整洁和梦幻。从这个整机房的俯视图看,数据中心采用了厂房式大开间框架结构,封闭热通道的一排排机柜构成庞大微模块阵列,机房顶部是供电网络桥架和消防管路,服务器和交换机的状态灯闪烁着,只有极少量的机房级照明。整个房间面积很大,走道以及顶部空间都非常宽敞,但设备区却较为紧凑,机柜间冷通道才两块砖多点的距离(标准砖宽度为600mm),其中热通道占用了大约两块砖的距离,而且服务器机柜的深度较短,也就一块砖多些。从图片较近处还可以发现有蓝色布帘密封的地方,空缺的位置是留给服务器机柜的,这也说明了Google的服务器部署是以机架为单位快速安装部署的。该蓝色布帘密封可以隔绝冷热气流的混合,减少冷量的浪费,体现了精细化运营的思想。高密度的服务器采用全正面维护,顶部为密集的TOR交换机单元。
从这个图还可以看出Google采用创新的空调置顶散热方式,整个机房大环境作为冷通道提供冷量给服务器吸入,加热后的热空气在封闭通道内上升,然后通过热通道顶部的空调盘管制冷并被几个烟囱状导风管和大散热风扇重新循环回外部冷环境。这种空调置顶布局虽然存在着盘管漏水、更换维护较难等风险,对产品质量和施工工艺要求非常高,但是其气流组织较为合理,比如热气流自动上升,冷气流自动下沉,可以减少风扇的功耗,且机房大冷池环境可以作为缓冲池等,减少局部空调故障引发的热保护。据相关资料显示Google微模块的整个热通道温度非常高,像个大烤箱,温度可以达到49摄氏度,以至于一旦必须进去维护,那么服务器必须关掉才行。采用热通道封闭可以提供一个较为舒适的现场运营环境,热量只被限制在热通道中并被冷冻水带走,考虑大开间的铁皮厂房冷量密封保温特性不太好,但因为Google服务器的高温工作特性(如图中Google服务器的深度较短,大约只有600mm多的深度,散热会比较容易),送风温度高达27摄氏度,因此这个较高温度下的冷量传递损失不会很大,围栏效应的影响几乎可以忽略。
从上面这张照片可以看到Google微模块热通道内部的一些细节,比如热通道宽度大约是两块标准地板砖,里边安装的是机柜顶部空调盘管的安装支架和加固支撑,通过地板底下的快接软管提供冷冻水给热通道顶部的空调盘管提供冷冻水。从冷冻水管的数量和密度上看,顶部空调盘管也做了模块化冗余设计,是个很不错的设计。服务器全正面维护,每台服务器采用三个分布式较大风扇散热,绿光来自服务器内部LED状态灯。Google自行设计的服务器采用尽可能少的能耗,并控制风扇转速足够低,只要服务器内部温度不要超过设定值就可以了,处处都体现节能。
Google在供电和制冷等方面总能打破常规,而没有采用商用的传统UPS和精密空调方案,体现了创新颠覆的思想,甚至如右边图Google还申请了三明治服务器的专利,采用液冷散热片,上下两个服务器靠此散热片内部的冷冻水以及循环风扇带走热量等。
当然也不是Google的所有机房都采用这些创新的散热方案,比如一些网络设备间和POD小机房等,如下面的这两个例子。该网络设备间采用了传统的风管上送风或者地板下送风方式散热,双路冗余高可靠供电,但是在这些传统机房模块中Google都采用了简单低成本的塑料帘子隔离冷热通道方案,避免了冷热气流直接混合短路,也大大提高了其能源利用效率。据早期谷歌发布的一个POD机房优化视频中可以看到,通过对这些传统机房的精细化运营,比如机房CFD仿真改善气流组织、采用如上的冷热帘隔离、提高送风温度、安装了蓝色LED灯用于照明等等措施,使得PUE从原来的2.4降低到1.5以下,这也说明即便不用很多创新的思路,通过运营优化也可以实现较好的节能优化效果。
三、Google服务器篇:
步入Google的大型数据中心,整个机房的服务器阵列非常整齐壮观,海量的服务器风扇同时运转带来巨大的噪音,以至于进入数据中心必须佩戴防噪耳塞。从下图可以看到Google的服务器上架有两种配置方式,分别是低密的十五六台一个柜子,以及高密的每机柜接近三十台左右(可能采用类似facebook的1.5U高效风扇设计),TOR交换机置顶,PDU和网络快速接口都在左侧。每台服务器多含有2个或者更多的子机,服务器没有前面板也无上盖板成本更低散热更好,服务器通常很短,采用不同颜色的网线做功能区分,网线和电源线采用快插接口,plug and play。机柜底下滚轮设计方便整机架快速部署和搬迁,全正面维护,方便现场快速维修和免工具更换。
从这些照片也可以看到不同版本不同类型的Google服务器设计,和早前发布的带铅酸电池服务器设计不一样,新版本的服务器结构更为方正美观,但即便如此这些自行打造的简单易维护服务器要比标准的商用服务器要便宜不少。尽管仍被视为互联网公司,Google已经成为世界上最大的硬件制造商之一, 因为它的设备多数是自己制造的。1999 年的时候,H?lzle从“三个开电子商店的家伙”那里买了 2000 个剥离下来的电路板。通过改造,去除不必要的部件,Google 构建了自己的服务器(DIY服务器的价格是1500 美元 ,而当时的商用机价格约为5000 美元),考虑到其上百万量级的服务器设备,那么DIY服务器带来的成本节约会是天文数字。由于DIY简单易维护设计,如果服务器出了故障,甚至可以免工具快速维修,如果实在无法维修则直接报废拆解成电子垃圾回收。且Google在定制的服务器内部安装了分布式的带电池UPS,可以省掉传统数据中心大量UPS的采购成本,并且采用该内置UPS可以实现供电效率99.9%,相比传统的UPS方案也可以实现数据中心总节能15%,在能源紧张运营电费高企的今天也是非常大的费用节省。
为了统一管理自己的服务器,Google 开发了一个软件系统,开发者能够通过这个系统指挥数千个电脑, 如同一个计算机一样。在 2002 年的时候,它创造了 Google File System,可以在不同的机器上顺利地传送文件。MapReduce 是 Google 为编写云端服务而开发的系统,它的开源版本 Hadoop 已经成为业界标 准。另外,Google 还开发了一个自动化的决策系统 Borg,用于决定那条机器最适合某项任务。这对服务器集群的稳定性提出了更高的要求。为此,Google 内部有一个团队,叫做 SRE(网站可靠性工程团队),他们的任务就是使用各种方法,对服务器进行破坏,以检测公司进行危机处理的能力。每年,SRE 都会进行一次虚拟的战争,叫做 DiRT(disaster recovery test)。攻击是虚假的,但是几乎和现实一样,危机管理人员必须按照处理程序来做,如果他们不能找出处理方式,攻击就必须停止,以免影响到真正的用户。
在Google公司内部的某个墙上展示着一排排的主板,那些代表着Google成立以来自己打造的不同时代的服务器,其中有一块标明着2008年7月9日,那是Google有史以来的第一百万台服务器,但这是个累计的数字,并不意味着那个时间Google已经拥有百万台服务器的规模。
四、数据中心建筑篇
Google每个数据中心的选址都是非常谨慎的,以下图哥伦比亚河畔的Dalles数据中心为例,选择建设在河流旁边开阔的谷地,且可以看到其典型的建筑风格是大开间低层厂房结构,多为结构较为合理的长条矩形状,大型架空冷却塔和底下的储冷罐位于建筑边上,附近是两个为数据中心配套的变配电站。直接采用附近水电站便宜的绿色充足水电来给数据中心供电,空气质量很好。类似选址的还有比利时数据中心采用运河的水处理后来散热,以及芬兰湾哈米纳数据中心直接采用海水来给数据中心散热,而不像国内数据中心受限于种种原因大型DC多在沿海城市,气温及空气质量不好、电力容量少电费高、多层建筑租金昂贵等。
Google的IDC选址多位于能源较为丰富,气候条件较好的地方,一则可以大量使用绿色低成本的能源,同时还可以利用较为优越的地理气候条件实现更为节能的自然冷却,目前其主流的数据中心年PUE基本可以达到1.2以下的很好水平。且数据中心和周边自然环境融合很好,比如数据中心周围倘佯的小鹿,漫山的野花,氤氲的冷却塔蒸汽,静谧的河流以及雪地垂钓等,都体现了人与自然的和谐相处。
五、结语
Google非常注重自己的信息安全,这一点也可以表现在使用过的硬盘全被销毁,就数据中心的创新技术而言,Holzle说Google付出了鲜血、汗水和眼泪,也希望其他公司也能付出自己的艰辛来自己打造,成就更多的发现和伟大。
通常Google透露出来的都是一两代之前的技术,虽然这次这么较大规模的公开其数据中心的秘密,但一如Google自己说过的,一旦他们自己的员工看过了Google正在打造的2013年下一代数据中心和服务器集群,那么他们将无比抱怨目前的这些设计。即便如此本次披露的这些数据中心也像是一件件精美的艺术品,使用的技术也是业界非常领先的,让我们在拭目以待Google更多更新数据中心技术的同时,也同时能够从这些资料中学习并理会其思想,并同样有孜孜不倦的创新精神和通过专注实现完美设计,再次与大家共勉。
相关推荐
-
评估您的数据中心的需求和数据安全问题
单是拥有选址上的优势还不足以让数据中心满足客户需求和生存下去。看完前面的文章,你是否会考虑钻到地底或者深入大海来解决烦人的数据安全问题?
-
数据中心选址:地下或不寻常之地
在世界各地的网站上都能发现这些选址千奇百怪的数据中心,因为这些位置具备特殊优势来应对常见问题。
-
谷歌数据中心:数据避风港还是海上浮动货柜?
在2013年,看似集装箱式数据中心的驳船出现在旧金山湾和缅因州波特兰的海港,有关谷歌带来远洋数据中心的种种猜测成为公众关注的焦点。
-
数据中心巨头使用可再生能源的乐与忧
大型数据中心,如苹果与谷歌的已转向可再生能源发电去抵消成本。使用这种方式,早期采用者面临各式各样的挑战。