随着国内金融业全面对外开放和国内大型企业数据大集中的工作,我们已看到数据中心作为一种物理载体在企业发展和运营中的作用越来越突出,也看到国内很多大型 IT 公司、金融、电信、政府等行业的数据中心在不断地投入建设。笔者有幸参加了一些大型数据中心项目的设计工作,根据一些项目的体会以及结合手中所掌握的国际国内有关此方面的资料,对数据中心各等级的特性要求作一分析与汇总,供同行参考。
一.关于数据中心的定义
数据中心(Data Center)通常是指在一个物理空间内实现对数据信息的集中处理、存储、传输、交换、管理,一般含有计算机设备、服务器设备、网络设备、通讯设备、存储设备等关键设备。数据中心的基础设施 (Data Center Infrastructure) 是指为确保数据中心的关键设备和装置能安全、稳定和可靠运行而设计配置的基础工程,也称机房工程 (Facility Site Engineering) ,数据中心机房工程的建设不仅要为数据中心中的系统设备运营管理和数据信息安全提供保障环境,还要为工作人员创造健康适宜的工作环境。
二.数据中心设计的依据和标准
目前国内外与数据中心有关的工程建设标准主要有《电子计算机机房设计规范》(GB50174-92)、《电信专用房屋设计规范》(YD/T5003-2005)、《美国通信工业协会(TIA)发布的《ANSI/TIA-942–2005,Telecommunications Infrastructure Standard for Data Centers(数据中心的通信基础设施标准)》,它们是数据中心建设定位、功能指标、设计技术、施工工艺、验收标准等的具体技术要求与体现。其中美国通信工业协会(TIA)发布的《 ANSI/TIA-942–2005,Telecommunications Infrastructure Standard for Data Centers(数据中心的通信基础设施标准)》是国际上第一部较为全面地以数据中心为对象的技术规范标准,它为现代的机房工程建设提出了新的设计理念、系统构架与技术指标,并给出了许多的技术与系统的工程建议与指导。
TIA-942《数据中心的通信基础设施标准》是由美国通信工业协会(TIATR-42.2 委员分会制定,并由美国国家标准学会(ANSI)和美国通信工业协会(TIA)于2005年4月12日共同发布,这是该标准的第一版本。该标准所说的数据中心可以是政府或企业自有产权的自有数据中心,也可以是运营商用于租赁服务的公用数据中心。该标准描述了各类数据中心或计算机房中,对通信基础设施的起码的、最低的要求。
三.数据中心机房的等级及其分级的依据
在国内标准《电子计算机机房设计规范》(GB50174-92)中主要从机房选址、建筑结构、机房环境、安全管理及对供电电源质量要求等方面对机房分级,可分为A(容错型)、B(冗余型)、C(基本型 )三个级别。
在美国标准TIA-942《数据中心的通信基础设施标准》中主要是根据数据中心基础设施的“可用性(Availability)”、“稳定性(Stability)”和“安全性(Security)”分为四个等级:Tier I、Tier II、Tier III、Tier IV。其中这四个等级可用性的划分是源于美国标准The Uptime Institute Inc.的《Industry Standard Tier Classifications Define Site Infrastructure
Performance 》(《采用分类等级的方式定义场地基础设施性能的工业标准》),在该标准中,美国 The Uptime Institute依据工程需求与实践,提出了场地基础设施的分类等级的体系框架,针对数据中心的关键设备期望达到“五个九”即99.999%的系统应用可用性的需求,提出了要与之相匹配的机房场地基础设施(电源配电、暖通空调、以及其他的相关系统)的可用性等级指标。
四.在 TIA-942 标准中数据中心各等级的特性及要求
根据 TIA-942 标准,数据中心机房可分为四级:由“等级 Tier I”没有冗余部件组成的系统(可提供99.671%的可用性)到“等级Tier IV”有冗余部件(能够故障容错)和实现不间断维修的系统(可提供99.995%的可用性)。根据该标准场地的可用性分类等级框架分成四个层次等级,下面将介绍该标准中每个等级的特性及其数据中心基础设施等级的类型、要求和相关特性:
(一) 等级Tier I――基本数据中心
“等级I”的数据中心对来自有计划和无计划的运营中断反映敏感(影响较大)。数据中心配有计算机电力分配和冷却,但是它可以或不一定有架高的活动地板,一台UPS或者一台发电机。在这些系统上的关键的负荷能达到N的100% 。如果它确实有UPS或者发电机,他们是单个模块的系统并且有很多单个的故障点。一个年度内场地内基础设施被完全关闭停运,是基于进行预防性检修和修理的需要。紧急状态下可能需要频繁地关闭设施。场地内基础设施组成器件故障、操作错误,以及自然产生地失败将引起数据中心运营的中断。等级I由电力和冷却分配的一条单通路组成,没有多余的组成部分,提供99.671%的可用性。
(二) 等级Tier II――基础设施部件冗余
“等级II”的数据中心采用设备部件冗余要比“基本数据中心”有计划和无计划的运营中断反映稍微要少(影响较小)。场地内有架高的活动地板,一台UPS和发电机,动力的能力设计是N+1,全部有条单一的分配线路。关键的负荷能达到N的100% 。关键线路的维修和场地内其他基础设施的维修维护将需要一次处理性关闭中断。等级II由电力和冷却分配的一条单通路组成,带有多余的组成部分,提供99.749%的可用性。
(三) 等级Tier III――基础设施同时可维修
“等级III”的数据中心具有能够进行任何有计划的场地基础设施活动,而又不应使计算机硬件系统运行中断的能力。有计划的活动包括预防性和程序性的维修,修理和替换零部件,添加或调整部件的容量,部件和系统的测试。对使用冷冻水系统的大型场地来说,这表示两套独立的管路。要有足够的能力和分配,一定可提供在进行维修或者在其它管路上测试时,在一条管路上同时带负荷。无计划的活动,例如设备基础设施的零部件,在运行中或者自然的情况下发生故障,引起数据中心的运行中断。在一个系统上的关键的负荷不超过N的90%。当客户的业务需要得到正当合理的额外保护时,“等级III”的场地将被有计划地设计成可升级成“等级IV”的场地。等级III由多条有效的电力和冷却分配道路组成,但是只一条道路活跃,有多余的组成部分,并且同时是可维修的,提供的99.982%的可用性。
(四) 等级Tier IV――基础设施故障容错
“等级IV”的数据中心具有能够进行任何有计划的的活动且不会对关键的负荷造成中断的能力,且有提供场地基础设施容量及其能力。基础设施故障容错的功能性为场地基础设施的能力提供至少维持一种最坏的情况,无计划的故障或者事件将不影响关键的负荷。这需要同时活跃的分配道路,通常在S+S的双电源系统配置里。电力系统供应表示为每个有N+1冗余的两个单独的UPS系统。在一个系统上的涉及的关键的负荷不超过N的90%。“等级IV”需要全部计算机硬件有故障容错的双电源输入。严格的故障容错测验使数据中心具有维持无计划故障或者运行错误时,不发生计算机机房过程中断的能力。等级IV由多条有效的电力和冷却分配道路组成,有多余的组成部分,并且是故障容错,提供的99.995%的可用性。
综上所述,我们可以用以下几个对照表来总结数据中心的设计依据及其各等级的特性和要求:
1. 数据中心建设相关标准
类别 | 级别 | 具体内容 |
国家规范 《电子计算机机房设计规范》(GB50174-92)、《电信专用房屋设计规范》(YD/T5003-2005) | A(容错型)、 B(冗余型)、 C( 基本型) | 从机房选址、建筑结构、机房环境、安全管理 及对供电电源质量要求 等方面对机房分级,分为A、B、C三个级别 |
美国标准 ANSI&TIA-942数据中心通讯网络基础设施标准 | Tier I | 单电源和冷却分布,没有冗余的构件,仍受计划性和非计划性活动所带来的中断影响,只可提供99.671%的可用性(基本数据中心) |
Tier II | 单电源和冷却分布,有冗余的构件,可轻微减少计划性和非计划性活动所带来的中断影响,只可提供99.749%可用性(冗余设计数据中心) | |
Tier III | 多路可用的电源和冷却分布通道,但平时只有一路在使用,由冗余的构件,可并行维护,所有计划性的基础设施相关活动不会影响计算机硬件的正常运行,只可提供99.982%的可用性(可并行维护数据中心) | |
Tier IV | 多路可用的电源和冷却分布通道,有冗余的构件,并支持容错能力,只可提供99.995%的可用性(容错数据中心) |
2. 国际行业标准ANSI&TIA-942关于数据中心分级的一些主要技术指标
项目 | 第一级 基本 | 第二级 具冗余单元 | 第三级 可并行维护 | 第四级 容错 |
数据中心可用性 | 99.671 % | 99.749 % | 99.982 % | 99.995 % |
每年由于基础设施引起的 IT 服务中断时间 | 28.8 小时 | 22.0 小时 | 1.6 小时 ( 96 分钟) | 0.4 小时 ( 24 分钟) |
建筑物类型 | 租用 | 租用,且其它租户没有危险 | 独立运行,且必须都是数据中心或电信运营商(或自有) | 独立运行,且必须都是数据中心或电信运营商(或自有) |
供电通路数量 | 仅有一路 | 仅有一路 | 一路主用,一路备用 | 两路互为热备 |
供电冗余措施 | N | N+1 | N+1 | S+S 或 2(N+1) |
UPS 电源冗余 | N | N+1 | N+1 | S+S 或 2(N+1) |
发电机容量 | 仅供计算机及通信系统设施的用电及其动力 | 仅供计算机及通信系统设施的用电及其动力 | 仅供计算机及通信系统设施的用电及其动力,冗余一台 | 供大楼内所有负载,冗余一台 |
根据所安装 UPS 的容量正确选择发电机 | 是 | 是 | 是 | 是 |
发电机燃料供应时间(满负载运行) | 8 小时(如果 UPS 有 8min 的备份时间可以不设置) | 24 小时 | 72 小时 | 96 小时 |
UPS 电池最少满负载备份时间(有发电机应急电源系统) | 5min | 10min | 15min | 15min |
重要负载的自动切换 | 设置带维护旁路的 ATS ,一旦发生断电, ATS 自动切换到发电机供电回路 | 设置带维护旁路的 ATS ,一旦发生断电, ATS 自动切换到发电机供电回路 | 设置带维护旁路的 ATS ,一旦发生断电, ATS 自动切换到发电机供电回路 | 设置带维护旁路的 ATS ,一旦发生断电, ATS 自动切换到发电机供电回路 |
负载同步控制器 LBS | 无 | 无 | 有 | 有 |
动力设备和环境集中监控系统 | 无 | 无 | 有 | 有 |
分类 / 分区供电 | 不是 | 不是 | 不是 | 是 |
关键的负荷可用度 | 100 % N N 的 100 % | 100 % N N 的 100 % | 90 % N N 的 90 % | 90 % N N 的 90 % |
初始的用电总量(瓦 / 每平方英尺)(典型值) | 20-30 | 40-50 | 40-60 | 50-80 |
最终的用电总量(瓦 / 每平方英尺)(典型值) | 20-30 | 40-50 | 100-150 | 150+ 150 以上 |
连续冷却 | 没有 | 没有 | 或许 | 是的 |
场地空间架空中活动地板的比率 | 20% | 30% | 80%-90% | 100% |
架空活动地板的高度(典型值) | 12 ” 30CM | 18 ” 45CM | 30 ” -36 ” 75 -90CM | 30 ” -36 ” 75 -90CM |
地板荷载磅 / 每平方英尺(典型值) | 85 | 100 | 150 | 150 |
并行维护能力 | 没有 | 没有 | 有 | 有 |
容错能力 | 没有 | 没有 | 没有 | 有 |
单点故障 | 很多 + 人为错误 | 很多 + 人为错误 | 有一些 + 人为错误 | 一个没有 + 人为错误 |
人员配备 | 没有 | 1 班 | 超过 1 班 | 7*24 小时 |
值班 | 没有值班 | 1 名值班 | 1 名值班 + 轮班 | 永远 24 小时值班 |
场地的可用性 | 99.671% | 99.749% | 99.862% | 99.995% |
3. 国际行业标准ANSI&TIA-942标准对数据中心选址的技术指标要求
内容 | Tier I | Tier II | Tier III | Tier IV |
临近水灾区域 | 没有要求 | 不能在水灾区域 | 不在百年一遇的水灾或至少离开 50 年一遇的水灾区域 91 米 | 至少离开百年一遇的水灾区域 91 米 |
临近海岸或内陆河流 | 没有要求 | 没有要求 | 不小于 91 米 | 不小于 800 米 |
临近主要的交通要道 | 没有要求 | 没有要求 | 不小于 91 米 | 不小于 800 米 |
临近机场 | 没有要求 | 没有要求 | 不小于 1.6 公里 ,最好大于 48 公里 | 不小于 8 公里 ,最好大于 48 公里 |
临近主要城市区域 | 没有要求 | 没有要求 | 不大于 48 公里 | 不大于 16 公里 |
源自: ANSI&TIA-942Telecommunication Infrastructure Standard for Data Centers |
4. 国际行业标准ANSI&TIA-942标准对建筑设计的技术指标要求
内容 | Tier I | Tier II | Tier III | Tier IV |
在建筑物内有多个租户 | 没有限制 | 没有危险的其他租户 | 必须是数据中心或电信运营商 | 必须是数据中心或电信运营商 |
来访人员停车场与机房外墙的距离 | 没有要求 | 没有要求 | 至少离开 9.1 米 | 至少离开 18.3 米 ,并通过物理障碍防止车辆靠近 |
来访人员和内部人员的停车场分离 | 没有要求 | 没有要求 | 通过栏栅或墙物理分离 | 通过栏栅或墙物理分离 |
机房周边没有对外的窗户 | 没有要求 | 没有要求 | 是 | 是 |
公共厕所和休息室与计算机房的分离 | 没有要求 | 没有要求 | 如果是直接相邻,需要配备水灾保护挡板 | 不能直接相邻,并配备有水灾保护挡板 |
防暴设计的墙、窗户和门 | 没有要求 | 没有要求 | 最小为 Level3 | 最小为 Level3 |
5. 国际行业标准 ANSI&TIA-942 标准对通信网络的技术指标要求
内容 | Tier I | Tier II | Tier III | Tier IV |
经不同路由接入的电信运营商的入口和维护口至少间隔 20 米 | 无 | 是 | 是 | 是 |
多个电信运营商 | 无 | 无 | 有 | 有 |
第二个接入机房 | 无 | 无 | 有 | 有 |
第二个配线区域 | 无 | 无 | 无 | 可选 |
冗余的骨干路由 | 无 | 无 | 有 | 有 |
冗余的垂直布线 | 无 | 无 | 无 | 可选 |
路由器和交换机有冗余的电源供应和处理器 | 无 | 有 | 有 | 有 |
配线板和跳线(跨接线)都应有该标签 | 无 | 有 | 有 | 有 |
配线板和配线文档应符合 ANSI/TIA/EIA-606-A 和标准附件 B 对标签的要求 | 无 | 无 | 是 | 是 |
六.结束语
我们都知道通过数据大集中,银行、电信、IT企业等各大行业能够实现业务的集中管理,能够在全国的范围内提供同等水平的业务服务,提高了客户的满意度;与此同时业务数据的集中存储与管理,为高水平的安全的数据保障创造了条件,业务连续性到了一个新的高度。但是随着数据大集中,所带来的问题是对数据中心的计算机系统及其设施安全性、稳定性、可靠性提出了更高的要求。
综上所述,可知数据中心的构建设计并不是一个简单的问题,它所涉及的技术非常的复杂,是集建筑、结构、电气、暖通空调、给排水、消防、网络、智能化等多个专业技术于一体。在实际设计中,应结合工程的实际情况及所建数据中心的等级要求,遵循实用性、先进性、安全可靠性、灵活性与可扩展性等原则,使所建的数据中心能够满足计算机等各种微电子设备和工作人员对温度、湿度、洁净度、电磁场强度、噪音干扰、安全防范、防漏、电源质量、振动、防雷和接地等的要求;并且应该是一个安全可靠、舒适实用、节能高效和具有可扩展的数据中心。
- 参考文献1:《美国通信工业协会(TIA)发布的《ANSI/TIA-942–2005,Telecommunications Infrastructure Standard for Data Centers(数据中心的通信基础设施标准)》
- 参考文献2:《电子计算机机房设计规范》(GB50174-92)
- 参考文献3:《电信专用房屋设计规范》(YD/T5003-2005)
- 参考文献4:《机房技术与管理》2006第6期――《对数据中心TIA-942标准的理解》
- 参考文献 5 :《银行灾备备份系统建设情况简介》-陈天晴
- 参考文献 6 :《中国人民银行关于加强银行数据集中安全工作的指导意见》-银发(2002)260号
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
相关推荐
-
看IBM数据科学团队如何助力企业用户AI项目
在下面的Q&A中,IBM公司的Seth Dobrin探讨了如何提高企业用户对机器学习和AI项目的兴趣, […]
-
DR基础知识:灾难恢复计划和灾难恢复策略
IT灾难恢复(DR)计划的主要目标是制定详细的恢复计划,以在意外中断时执行。 这种计划应该列明详细步骤,说明在 […]
-
为超融合架构选择合适的数据中心冷却系统
超融合基础架构会给新的数据中心冷却方面带来一些新的挑战,在选择和实施之前,我们来看看哪些温度和冷却单元的效率是最好的……
-
IDC Directions 2017:值得期待的智能数据中心技术
智能技术能够让数据中心变得更为自动化、简单,不过企业需要为其实施做好准备,了解如何从旧的设备平稳过渡至智能的数据中心。