剖析英特尔至强E5 v2:新22nm工艺带来哪些改变

日期: 2013-12-08 来源:TechTarget中国

早在2007年英特尔正式提出Tick-Tock芯片设计制造业务的战略模式,即每一次处理器微架构的更新和每一次芯片制程的更新遵循“Tick-Tock”规律。对于至强系列处理器而言,遵循“Tick-Tock”规律,09年发布代号“Nehalem-EP”的至强5500处理器可以说是一个战略重点,该处理器首度集成内容控制器、全新QPI总线架构以及超线程等一系列全新技术。

而在此后的产品更替换代中,英特尔陆续发布了至强5600和至强E5-2600、2400产品,而最新一代至强E5新产品:英特尔至强E5-2600 v2也在今年9月份正式登台亮相。而英特尔将至强E5-2600 v2产品家族(代号为“Ivy Bridge-EP”)定位在重新定义数据中心的服务器、存储与网络基础设施上,宣称较前代提升45%电源、使用效率及最高50%的性能。

相比较上一代至强E5-2600产品的变化
相比较上一代至强E5-2600产品的变化

新处理器代号为Ivy Bridge-EP,采用22纳米制程,共推出18款型号,最多内建12个核心,适用于高密度运算应用,每颗处理器报价从202到2614美元;英特尔还推出三款用于工作站的单插槽Xeon E5-1600,从294美元到1080美元。

E5-2600 v2系列处理器
E5-2600 v2系列处理器

就产品而言,英特尔至强E5-2600 v2产品家族22nm工艺制造可以说是一个提升,比上代SNB-EP架构E5-2600性能提升最多50%,能效改进最多45%,并支持数据保护等高级安全技术。Intel还宣称该系列处理器在企业计算、虚拟化、能效、Web、技术计算、数据库等方面提供全面的创新价值。

据了解,对于Ivy Bridge-EP架构的主要参数变化来说,最主要就是核心数从8核16线程提升到12核24线程,内存频率也从DDR3-1600提升到了DDR3-1866,三级缓存也从20MB提升到30MB,在22nm制造工艺下处理器的TDP依然维持在原有水平上。 

至强E5 v2:性能变化不是唯一

每一次“Tock”代表着在上一次“Tick”的芯片制程的基础上,更新微处理器架构提升性能。Ivy Bridge属于英特尔Tick-Tock战略中的Tick+,相比Sandy Bridge其制程工艺提升至22nm,而且架构也得到进一步优化。考虑到制程的提升,因此在单线程性能方面的提升幅度并不会很大,内核在IPC方面的提升还是较为有限。

Romley EP平台的特点
Romley EP平台的特点

IVB提升还是较为有限,根据英特尔官方的性能提升数据,至强E5-2600 V2与前一代产品相比,能效提高多达45%,能够快速运行多种计算密集型工作负载,最高可将性能提升50%。

对于产品技术方面,之前的32nm Sandy Bridge就实现了处理器、图形核心、视频引擎的单芯片封装,其中图形核心拥有最多12个执行单元,支持DX10.1、OpenGL 2.1。而22nm Ivy Bridge将执行单元的数量翻一番,达到最多24个,自然会带来性能上变化。

Ivy Bridge-EP与Sandy Bridge-EP对比
Ivy Bridge-EP与Sandy Bridge-EP对比

新一代的Ivy Bridge-EP提供了更多的核心,有4-12个多种偶数核心规格供选择。而在最多的12核心处理器中,我们可以看到几个明显的特点:更多的环形总线、双内存控制器和更大的L3缓存。

10-12核心处理器上看到3条环形总线、2个三级缓存和2个内存控制器。增加了更多的缓存和内存控制器,英特尔让每个核心到达缓存的距离一致,降低延迟。而在环形总线方面,通过一条巨大的总线实现了所有核心部件之间的连接,这主要是实现核心之间通信的便捷。

尽管内核架构带来的性能提升有限,但并不意味E5-2600 V2在E5-2600基础上的性能提升不显著。大部分提升当然主要来自P1270处理器:22nm的3D立体晶体管技术(取代32nm平面晶体管技术)。具体的性能提升可以参考如下示意图:

SNB和IVB的能耗、性能对比
SNB和IVB的能耗、性能对比

从以上可以看出,IVB至强能提升25%的性能,同时消耗的能耗也更低。另一方面,P1270处理器支持英特尔采用更多内核和更高主频。这些可以体现在高端至强E5-2600平台上。比如上一代的高配版至强E5-2680,主频高达2.7GHz,TDP为130W,但同样主频的至强E5-2697 V2在同样TDP的情况下,其内核多4个。

虚拟化性能有效改善

随着x86服务器成为云计算基础设施部署的主要产品,其中虚拟化技术是对新一代x86产品最重要的考验。每一代新至强芯片都会减少虚拟机的进入(VMentry)和退出 (VMexit)操作周期,但还有一种降低硬件虚拟化资源代价的方法就是尽量避免VMexits。客户OS需要检查中断享有优先权,并通过检查APIC Task Priority Register(TPR)来实现。

APIC.TPR虚拟化
APIC.TPR虚拟化

早在08年时英特尔就在至强7400上引入了一种外部中断的优化方案,它主要是借助英特尔的VT FlexPriority来实现。通过确认虚拟化APIC TPR推出虚拟备份,客户OS无需VMexit即可读取寄存器。

APICv技术

APICv技术

Ivy Bridge内核通过“内部”中断可以减少VMexits。虚拟化处理器需要访问APIC寄存器,而寄存器是要求VMexit的。解决出路是APICv,新的至强处理器通过微代码可以被客户OS读取到,而无需VMexit。与此相关的,Sandy Bridge引入了对更大页面VT-d的支持,但实际上仍然会分成4KB的页面大小。Ivy Bridge在VT-d中完全能够支持大页面。

在虚拟化特性上,至强E5-2600 v2对服务器虚拟化的CPU占有率更少,性能方面接近于物理性能。此外,至强E5-2600 v2还对一些特殊的应用做了优化,比如在高性能计算方面和至强Phi之间更好的结合和应用,新扩展的指令集对于高性能计算相关的应用也特别有帮助。

另外一个很重要的改进是“FS和GS基址寄存器快速访问”,寄存器在当代的64位OS寻址系统中不需要使用(除了二进制VMM)这一点已经令我们印象颇受,但对于大批量线程的服务器工作负载的“关键优化”的承诺,使得至强E5-2600 V2更具诱惑。

扩展能力及功耗变化

对于PCI-E方面扩展支持方面,不但延续支持PCI-E 2.0 x4,还会迎来新一代的PCI-E 3.0标准规范,而且是完整的全速x16,因此独立显卡方面可搭配单路PCI-E 3.0 x16或者双路PCI-E 3.0 x8。

在技术特性上,Ivy Bridge变化并不十分明显,之前vPro商业管理、Turbo Boost智能加速(动态频率)、Hyper-Threading超线程、AVX 1.0和AES指令集统统继承下来,只是主动管理技术会升级到AMT 8.0,并加入一些新的AES指令。

Ivy Bridge处理器
Ivy Bridge处理器

Ivy Bridge处理器延续了DMI+FDI总线设计,这也让Ivy Bridge可以良好的兼容Sandy Bridge平台。代号方面之前有人说2013年的22nm Haswell后边是应该是Rockwell,按惯例架构不变、工艺升级。其实真正迈入后20nm时代将是“Broadwell”,再往后工艺不变、架构革新的将是“SkyLake”。

更为先进的制造工艺,让Intel Ivy Bridge拥有更为强劲的性能。根据测试表明Ivy Bridge相对于Sandy Bridge同频性能能够提升10%左右。其次,Ivy Bridge带来了更加强悍的内存控制器。

可配置的TDP和低功耗模式
可配置的TDP和低功耗模式

不过,制造工艺的提升将会缩小CPU的核心面积,这也就缩小了CPU核心与顶盖之间的接触面积,CPU温度控制反而不如现在的SNB了。但IVB通过电源管理方面的改进,比如DDR I/O嵌入式电源门控,可在深度休眠状态完全关闭,可配置的TDP和低功耗模式。

可配置TDP(热设计功耗)将是Ivy Bridge的一大特色,能让同一颗处理器拥有多个不同的TDP,针对不同业务应用性能进行功耗的调整,并且会根据运行时触发器进行动态转换,从而提供更大的性能/功耗选择空间。

为存储提供技术改进

英特尔至强处理器E5-2600 v2产品家族还被设计用于支持高性价比的、可扩展的、分布式的和软件定义的存储。至强E5-2600 v2的变化明显体现在:内核与高速缓存增加50%、支持更快的DDR3 1866MTS内存、在双路系统上支持高达1.5TB的内存、改进的iPCIe 3.0充分发挥10GbE性能以及虚拟化和安全性方面创新。

新的至强E5-2600 v2发布之后,对存储市场的影响也是巨大的,英特尔将为更进一步的高性能在线重复数据删除、在线实时压缩、自动精简配置、集成IO支持10GbE和SSD、存储扩展(如NTB、ADR)、多种加速器(如AES-NI)等带来显着的改进。

内存延迟
内存延迟

在内存延迟与内存带宽方面,Ivy Bridge-EP相比上一代的Sandy Bridge-EP架构来说可以提供更快的内存速度,更好能效比和近似的延迟性能。可以看到,使用上一代Sandy Bridge-EP平台最高可以达到80GB内存带宽,而Ivy Bridge-EP处理器其带宽可以达到近90GB,若使用DDR3-1866的内存带宽可以达到100GB。

对比上一代在内存速度提升
对比上一代在内存速度提升

各大厂商也纷纷更新产品,英特尔至强处理器E5 v2产品家族为诸如PowerEdge VRTX及智能分层Compellent存储解决方案等戴尔高性能创新解决方案提供了坚实的硬件基础。而企业级存储系统从中低端到高端,主流产品都采用了英特尔处理器:IBM Storwize V5000V7000系列、EMC VNX和VMAX存储系统、NetApp FAS系列存储,尽管有些更新还处于上一代,但是足见英特尔至强处理器家族对存储市场的影响。

在英特尔至强x86处理器架构下,技术不断得到加强前提下进一步提高存储系统的性价比,而对于分布式的、可扩展的存储系统来说,企业级存储市场中软件定义存储更是英特尔至强x86处理器架构的强项。对于整个数据中心的架构,全新英特尔至强处理器将让数据中心的服务器、网络、存储中的软硬件更好的兼容,帮助企业推动数据中心转型。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

相关推荐