巧用垂直极化优化主机处理器性能水平

日期: 2016-10-17 作者:Robert Crawford翻译:朱文浩 来源:TechTarget中国 英文

为提高主机处理器的容量和速度,IBM开始应用垂直极化(vertical polarization)。阅读本文,了解如何通过名为HiperDispatch的功能充分利用该技术提升性能。 为了应对即将失效的摩尔定律(Moore’s Law),IBM正在寻找其他方法来提升处理器的处理能力。其采取的策略包括指令流水,超线程和处理器高速缓存。

这些新技术有时会使主机性能发生改变,如果足够稳定,性能的改变情况要取决于系统中发生的事件。要获得主机最佳性能的方法之一即是优化处理器的垂直极化。 不为人知的主机处理器内情 近期的主机处理器型号很大程度上依赖于高速缓存来供给指令流水。IBM最新型号的主机处……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

为提高主机处理器的容量和速度,IBM开始应用垂直极化(vertical polarization)。阅读本文,了解如何通过名为HiperDispatch的功能充分利用该技术提升性能。

为了应对即将失效的摩尔定律(Moore's Law),IBM正在寻找其他方法来提升处理器的处理能力。其采取的策略包括指令流水,超线程和处理器高速缓存。这些新技术有时会使主机性能发生改变,如果足够稳定,性能的改变情况要取决于系统中发生的事件。要获得主机最佳性能的方法之一即是优化处理器的垂直极化。

不为人知的主机处理器内情

近期的主机处理器型号很大程度上依赖于高速缓存来供给指令流水。IBM最新型号的主机处理器,z13,根据与中央处理器(central processor,CP)的距离不同划分为四个层级的高速缓存。每个核心拥有1级(L1)和2级高速缓存。3级高速缓存由芯片上的每个核心共享使用,而4级高速缓存在总线上可供任意处理器访问。数据必须在1级高速缓存中,处理器才可以使用。

众所周知的是主机可以高效率地运行不同的工作负载。这意味着在硬件状态之间的大量的内容切换,举例来说一项在线交易和一项批处理的工作要进行切换就需要大量的文件。

例如,只要某一生产逻辑分区(logical partition, LPAR)运行,它便会建立自己的缓存工作集,以促进更好的性能,主机处理器从内存或较低缓存上检索数据就会花更少的时间。接着,在某一点上,生产逻辑分区失去对测试系统中央处理器的控制。开发逻辑分区通过相同的处理流程将自己偏好的数据收集到缓存中,获得的效率只会将控制交还到生产系统上。在满载的处理器上,这一曲折的过程将导致缓慢的性能和更高的CPU功耗。

要解决这一问题,主机可以利用垂直极化的理念,其目的是使在物理处理器维持相同的生产逻辑分区,并且花费较少的时间进行缓存的加载和清除。为了推动垂直极化的应用,IBM引入了名为hiperdispatch的功能,同时还推出一组方法进行应用效果的测量。

当HiperDispatch功能启用时,操作系统的调度会与主机的虚拟机管理程序、处理器资源/系统管理器(Processor Resource/System Manager,PR/SM)相互协同。双方共同工作确保任何的逻辑分区能够在同一组物理处理器上连续运行,因此需要保存缓存中的内容,降低缓存丢失并提升处理效率。

衡量缓存效率的首要指标是相对巢强度(RNI,relative nest intensity)。IBM的RNI公式较为复杂,并且在计算每个型号的主机处理器上的RNI时会有差异,根据从不同层级的高速缓存和内存获取数据的时间来计算。较低的RNI表明比较有效的缓存利用率,这意味着CPU在等待指令和数据方面花费的时间会更少。

衡量的次要指标是每条指令的时钟频率(clocks per instruction,CPI)。这一测量方法会计算执行一条指令所需时钟循环的数量。处理器越深入高速缓存或内容,每条指令所需的时钟循环就越多,换句话说就是CPI越低越。该过程也是一种客观启示,相同程序中的相同数据因为不同数量的高速缓存的原因,所需要的CPU的数量也是不同的。

计算垂直中央处理器的数量

中央处理器垂直度有三类名称:

高度垂直(Vertical High)——物理处理器在某一逻辑分区上高效地投入工作;

中度垂直(Vertical Medium)——物理处理器在多个逻辑分区间可以实现共享;

低度垂直(Vertical Low)——物理处理器在没有计算需求时将停止。

一般来说,处理器资源/系统管理器分配垂直极性是基于逻辑分区的权重以及逻辑和物理处理器的数量。当处理器变得忙碌时,逻辑分区权重决定了分区的相对重要性和CPU共享份额。

当HiperDispatch功能启用时,各逻辑分区根据自己占总逻辑分区权重的情况以及总的物理处理器数量,来分配各自可以使用的中央处理器的数量。在实际业务中,有了z/OS系统和处理器资源/系统管理器的协调,每个z/OS操作系统在自己的垂直极化处理器上尽最大努力来协调工作。如果垂直极化的中央处理器过于忙碌,它可能会将工作发送至中高级处理器进行处理。

由于处理器资源/系统管理器能理解处理器底层的缓存结构,它将把中央处理器分配给相同或相邻芯片上的逻辑分区以缩短检索数据所需要的时间。鉴于处理器资源/系统管理器的复杂性以及决策的不透明性,系统程序员的最佳选择是下载IBM的逻辑分区设计工具。该工具采用复杂的Excel电子表格的形式,帮助用户来规划他们自己的逻辑分区配置以优化硬件性能。

作者

Robert Crawford
Robert Crawford

数据中心专家

相关推荐

  • 精简大型机系统管理的五项诀窍

    从容量规划到更高效的虚拟存储管理等等,市面上都有各种各样的工具及策略可以实现大型机性能的优化。在本文中,主要介绍了精简大型机系统管理的五项诀窍……